不斷縮小的決策窗口和更快的數據生成使得實時分析成為一種新興的熱門產品類別。Rockset首席執行官兼聯合創始人Venkat Venkataramani表示,現在,隨著大型語言模型(LLM)和矢量數據庫為企業人工智能鋪平了道路,我們突然進入了實時人工智能系統的時代。
(資料圖片)
不斷縮小的決策窗口和更快的數據生成使得實時分析成為一種新興的熱門產品類別。Rockset首席執行官兼聯合創始人Venkat Venkataramani表示,現在,隨著大型語言模型(LLM)和矢量數據庫為企業人工智能鋪平了道路,我們突然進入了實時人工智能系統的時代。
到目前為止,Rockset一直在開發一個關系數據庫,使用戶能夠對大量新輸入的數據連續運行SQL查詢。從傳統數據倉庫供應商到實時流處理器,許多大數據開發人員一直難以做到這一點。
Rockset通過在其開放的RocksDB的關鍵價值商店上構建的一系列功能來滿足實時分析需求。Rockset首席技術官兼聯合創始人Dhruba Borthakur在Facebook幫助下創建了關鍵價值商店。這包括Rockset強大的聚合索引功能,但也包括其非結構數據的接收、時間序列優化、查詢規劃和基于云的架構。
到目前為止,目標是讓實時應用程序能夠訪問通過Kafka管道到達的最新數據。與其他追逐實時分析夢想的數據庫公司(Imply、Clickhouse和StarTree)一樣,沒有任何一項出色的功能可以讓你突然成功地在大量傳入數據上運行每秒數萬次SQL查詢。相反,這是一種通過不懈的工程實現的能力。
但在4月份發生了變化,Rockset推出了對數據庫中矢量搜索功能的初步支持。新功能使Rockset不僅可以在其數據庫中存儲和索引向量嵌入,還可以將這些向量嵌入與元數據過濾、關鍵字搜索和向量相似性得分相結合。
Venkataramani表示,這些新的矢量相關功能將為客戶解鎖實時人工智能應用,特別關注產品推薦、個性化和欺詐檢測。
他說:“這方面以前稱為預測分析。能夠預測即將發生的事情。但如今,這都是實時人工智能。”
自去年年底ChatGPT出現以來,公司開始重新思考如何以及在哪里應用人工智能。Venkataramani表示,基于神經網絡和向量嵌入的新技術和技術正在顛覆五年前被認為是前沿的機器學習方法。
以產品推薦為例,這是一個經過時間考驗的數據科學家應用程序。與識別最具預測性的特征和屬性、構建自動提取它們的管道,然后在運行時仔細構建機器學習模型來推斷消費者偏好的艱苦過程不同,隨著LLM的出現,公司現在基本上可以將所有這些數據放入文本文檔中,并由神經網絡進行分類。
他說:“以前,機器學習模型會試圖提取關于你的產品、產品顏色、制造商、產品類別等的屬性。”“但現在,你可以給這些人工智能模型和神經網絡一個BLOB(表示二進制類型的大對象)的文本。你可以給每個產品一個圖像目錄,你不需要告訴它‘去標記這些圖像,說這是藍色的,屬于同一類。’”
“現在你可以提供用戶正在觀看的所有產品,人工智能模型可以理解用戶的喜好和厭惡,而不必根據特定的屬性和規則進行編碼。”“因此,你可以為用戶提供并構建一個向量,該向量代表了他們有更高機會喜歡或購買的所有潛在產品。”
這大大降低了在生產中使用人工智能的門檻,并使公司能夠利用人工智能做更多的事情。他說,理論上,這可以使一家公司對其目錄中的10萬件商品進行預測分析,而不是將其限制在前1000件商品。
有了人工智能,就好像一些機器人在觀察用戶的所有行為,并更深入地了解每一種產品,然后在用戶出現在網站上時實時構建推薦,而不是一小時后、一天后或一周后。可以個性化的程度已經達到了頂峰,因為現在可以將所有這些自動化。
Rockset不創建矢量嵌入(矢量嵌入是大量非結構化文本或圖像數據的濃縮表示)。但它確實允許用戶將向量嵌入基本上視為數據庫中的另一種數據類型,并對其執行操作,例如相似性搜索。
Venkataramani說: “我們不在乎你用什么模型來獲取非結構化數據并將其轉化為向量。” “把它想象成另一種數據類型,你的表中的另一列。你現在需要對它們進行相似性搜索。你需要說,給定一個向量,給我找到所有其他更接近我正在搜索的向量。”
假設客戶希望識別傳入數據流中所有類似雛菊的圖像(如果應用在公共安全而不是花園游覽,則可以將“雛菊”替換為“槍”或“刀”)。
Venkataramani解釋道:“我正在尋找的矢量是一朵雛菊,但這里是用矢量表示的所有其他圖像。” “現在你需要一個索引。如果你對整個庫進行強力搜索,這個問題需要10天才能得到答案。我希望在100毫秒內完成。你是怎么做到的?”
根據向量嵌入的索引運行機器學習算法,如K-最近鄰(KNN)或近似最近鄰(ANN),顯著加快了對輸入數據中雛菊和雛菊相鄰圖像的識別。
沒有人在數據庫中尋找這個確切的向量。他們在尋找所有更接近或最接近的向量,這就是索引在數學上比根據數字、字符串、日期或時間構建索引復雜得多的地方。這就是為什么矢量搜索是一種非常不同的功能,這也是Rockset所增加應對實時需求的有力功能。
不斷縮小的決策窗口和更快的數據生成使得實時分析成為一種新興的熱門產
標題:那些遙遠的星際真的與人類有關事件:中國航天科技集團有限公
來自中央戲劇學院的蔚雨晗是候鳥300戲劇板塊《達夫達夫》的演員,她向
創業板指上周創出三年新低后,本周強勁反彈,但場內資金卻借反彈離場,
第一,把買回來的小雞腿洗凈,與鹽生姜腌制…第二,通過至少四至五小時的
【吉魯追平亨利】法國隊史出場榜洛里145利利安-圖拉姆142亨利、吉魯123
連這個都錯了!臺軍自爆弱點,臺軍,臺海,國防部,解放軍,中印邊境,解放軍
榮耀GS3i智能手表46mm京東百億補貼活動價低至449元,曬單返10元E卡,最
證券時報網訊,6月17日,商務部消費促進司負責人談2023年5月我國消費市
極兔速遞是一家全球物流服務提供商
1、最小的質數是2。2、質數又稱素數。一個大于1的自然數,除了1和它自
全球最大“人造太陽”項目深陷泥潭6月16日消息,據《科學美國人》披露
來為大家解答以上問題,電腦wi-fi破解密碼,wifi密碼破解電腦版很多人
1、韓瑩目前世界排名第25位。2、韓瑩來自遼寧,1983年4月29日出生,她
本報訊(記者張宇虹竇曉峰通訊員張崇澤)“檢察機關不僅幫我們把孩子的
安徽安慶市正式成立“老年助餐慈善基
記者日前從安慶市民政局獲悉,該市慈善會近日設立老年助餐慈善基金,共同守護老年人舌尖上的幸福。該基金專項用于資助城鄉社區老年食堂、社
安徽淮北積極落實2022年電網防汛度汛
近日,國網淮北供電公司工作人員來到110千伏中泰變電站開展防汛隱患排查。該公司積極落實2022年防汛度汛措施,提前細化應急預案,推進極端
安徽全椒縣完善拓展人力信息資源助企
今年以來,全椒縣不斷完善拓展人力資源信息庫、勞務對接信息庫、企業用工需求信息庫三庫信息資源,已摸排400多家次企業缺工崗位信息1 2萬個
宿州市埇橋區柔性引進博士推進鄉村振
宿州市埇橋區實施博士匯工程,柔性引進29名博士擔任副鄉鎮長或園區副主任,他們將為加快產業發展、推進鄉村振興強化智力支持。目前,博士專
安徽印發出臺全面實施零基預算改革方
為進一步提高財政資源配置效率和資金使用效益,省政府印發《安徽省全面實施零基預算改革方案》,明確從編制2023年預算起,在全省范圍內全面
5月份安徽居民消費價格同比上漲2.3%
近日,國家統計局安徽調查總隊發布了我省5月份居民消費價格統計數據。統計顯示,我省居民消費價格同比上漲2 3%,同比漲幅比上月回落0 4個百分
安徽多種方式引導群眾防范非法集資風
合肥地鐵1號線、3號線上滾動播放防范非法集資宣傳視頻,淮南市發布《致老年群眾的一封信》……6月份是一年一度防范和處置非法集資宣傳月,今
鐵路部門持續加大長三角地區運力投放
記者從中國鐵路上海局集團有限公司獲悉,隨著上海疫情防控形勢持續向好,為進一步適應旅客出行需要,助力復工復產,鐵路部門自6月10日起持續加
安徽六安持續精準施策全力促進工業發
六安市與蔚來汽車簽署合作協議,共建智能電動汽車零部件配套產業園區。該園區一期計劃2023年上半年投產,建成后將具備年產30萬噸鋁壓鑄產能,
安徽淮北全力維護外賣送餐員合法權益
為切實防范化解新業態領域重大風險隱患,強化外賣送餐員權益保障工作,淮北市市場監管局充分發揮職能作用,全力維護外賣送餐員合法權益。淮北
湖南漣源開展專項行動一對一為企業紓
位于漣源市的湖南三合美新材料科技有限公司,兩條生產線滿負荷運行,生產聚氨酯和巖棉復合板。因產品升級與產能擴充,急需新增兩條生產線,
湖南藍山縣進村入戶排查整治自建房安
老叔,這棟房屋墻體有開裂痕跡,要維修加固,安全重要!5月20日,藍山縣塔峰鎮果木村,黨員干部上門開展農村自建房安全隱患排查整治。連日來
一季度湖南萬元產值綜合能耗同比下降
近日,湖南省工業通信業節能監察中心發布一季度全省六大高耗能行業能源消耗統計監測報告。據該報告,一季度全省146家主要高耗能企業的萬元
濟南起步區一年來累計簽約優質項目11
萬里黃河第一隧濟南黃河濟濼路隧道建成通車,占地4000余畝的新能源乘用車零部件產業園加快施工……記者21日采訪獲悉,建設實施方案獲批復一
山東發布通知啟動傳統民居保護利用試
省住房城鄉建設廳、省財政廳近日聯合印發《關于做好傳統民居保護利用試點工作的通知》,在全省部署開展傳統民居保護利用試點工作。此次試點