Tech

Pinecone pubblica il suo database vettoriale serverless dalla fase di anteprima

Pinecone, la startup del database vettoriale fondata da Edo Liberty, ex responsabile del laboratorio di intelligenza artificiale di Amazon, è stata da tempo all'avanguardia nell'aiutare le imprese a integrare i grandi modelli linguistici (LLM) con i propri dati. Più di recente, però, l'azienda ha completamente ristrutturato il suo prodotto per lanciare Pinecone Serverless, che libera i suoi clienti dal dover pensare a gestire le proprie distribuzioni e scalare. Oggi, Pinecone serverless esce dalla versione beta ed è ora disponibile in generale.

Liberty sottolinea che i primi clienti dell'azienda stanno ora passando dall'esperimentare con l'IA generativa a voler lanciare i propri prodotti di intelligenza artificiale. L'azienda ha osservato le imprese alle prese con la complessità di costruire nuove applicazioni, pur cercando anche il modo migliore per metterle in produzione.

“La prima ondata di applicazioni di grado di produzione sta colpendo il mercato ora e nei prossimi sei-nove mesi. Quello che i nostri più di 5.000 clienti ci hanno detto chiaramente è che hanno bisogno di un'applicazione dedicata, ottimizzata, specializzata che sia estremamente brava a fare la ricerca vettoriale, a fare RAG, a estrarre conoscenza e a generare contesti per questi modelli linguistici. Quello che stavano davvero dicendo è: hey, ho bisogno di scala, ho bisogno di prestazioni e ho bisogno che i costi siano tali da poter ragionare sul prodotto che sto costruendo.”

Crediti immagine: Pinecone

Liberty ha sottolineato che Pinecone ha speso molto tempo per rendere il prodotto pronto per le distribuzioni di produzione, rendendolo significativamente più conveniente. L'azienda crede effettivamente che i clienti che utilizzano Pinecone serverless possono ridurre i costi fino a 50 volte, anche perché il team ha ristrutturato il sistema per essere un servizio multi-tenant che disaccoppia la memorizzazione e il calcolo. Con ciò, i clienti di Pinecone pagano solo quando effettivamente consumano il tempo CPU, con l'azienda che orchestrare la capacità sul retro.

“Poiché gestiamo tutto come un servizio, la nostra capacità di orchestrare tutto ci consente di addebitare alle persone esattamente ciò che utilizzano, e non di più. Questo è incredibilmente raro e incredibilmente difficile da fare”, ha detto Liberty.

Fondatore di Pinecone Edo Liberty.
Crediti immagine: Pinecone

Durante la fase di anteprima pubblica, i clienti di Pinecone hanno chiesto anche molte altre funzionalità. Una di queste è Private Endpoints, che viene lanciata in anteprima pubblica oggi. Questo consente alle imprese di creare una connessione diretta ai propri cloud privati virtuali su Amazon tramite AWS PrivateLink, che non espone i loro dati all'Internet pubblico per garantire che i dati rimangano ben all'interno dei vari regimi di governance e conformità che un'azienda potrebbe dobbiamo attenerci.

Alcune delle aziende che stanno già utilizzando Pinecone serverless includono Gong, Help Scout, New Relic, Notion, TaskUS e You.com.

“Notion sta guidando la rivoluzione della produttività AI”, ha dichiarato Akshay Kothari, cofondatore e COO di Notion. “Il nostro lancio di una funzione AI in anteprima sul mercato è stato reso possibile da Pinecone serverless. La loro tecnologia consente al nostro AI Q&A di fornire risposte istantanee a milioni di utenti, provenienti da miliardi di documenti. Il nostro passaggio alla loro ultima architettura ha ridotto i nostri costi del 60%, avanzando la nostra missione di rendere la creazione di strumenti software ubiqua”.

Related Articles

Back to top button Back to top button