正在数字化海潮席卷全球的当下,人工智能(AI)已成为鞭策社会前进和财产升级的焦点力量。为了更好地应对AI时代带来的机缘取挑和,OceanBase于5月17日举办了第三届开辟者大会。本次大会不只深切解读了Data×AI计谋,还隆沉发布了面向AI的使用产物PowerRAG,为行业带来了全新的处理方案和成长思。OceanBase的AI计谋一号位、CTO杨传辉正在大会上阐述了Data×AI计谋。他指出,OceanBase正努力于建立Data×AI能力,面向AI时代鞭策一体化数据库向一体化数据底座的计谋演进。蚂蚁集团CTO何征宇正在分享中暗示,蚂蚁集团将支撑OceanBase正在金融、医疗、糊口等蚂蚁AI的焦点场景的冲破,支撑OceanBase去实践Data×AI的和架构立异。他指出,海量的互联网数据成绩了今天的大模子,但大模子问题的泉源也是数据问题。数据决定着大模子的能力上限,而当前数据范畴仍存正在获取成本高、行业数据稀缺且流动坚苦、多模态数据处置能力不脚以及数据质量评估难等四大挑和。面临这些挑和,杨传辉认为,OceanBase曾经具备了必然的AI时代数据处置能力,如分布式无效应对海量数据的存储计较、多模融合同一处置分歧布局数据、TP/AP一体化实现夹杂事务和及时阐发处置。但大模子落地发生价值的焦点正在于数据取模子的一体化融合,这也是OceanBase提出的建立Data×AI能力的环节。基于这一能力,OceanBase努力于从一个一体化数据库向一个一体化数据底座演进,通过一套引擎同时支撑TP/AP/AI夹杂负载,支撑向量数据库,实现SQL取AI的夹杂检索,这背后涉及OceanBase正在Data取AI范畴的工程取产物能力。正在Data×AI计谋的下,OceanBase正在本次大会上初次发布了面向AI的使用产物PowerRAG。这款产物将打制AI驱动的开箱即用的RAG办事,为用户供给强大的RAG使用开辟能力。杨传辉引见,保守RAG使用常用开辟模式存正在开辟周期长、成本高、灰箱调试坚苦、机能难以优化等问题。而OceanBase PowerRAG则打通了使用开辟数据层、平台层、接口层取使用层的全流程,供给Document(文档)和Chat(对话)两个焦点API接口,帮帮用户实现文档学问库、智能对话、图像比对、数据阐发等多种AI使用场景的快速开辟。“努力于成为AI时代的一体化数据底座,PowerRAG是OceanBase正在使用层面摸索的第一步,将来还将正在使用层面、平台层面不竭冲破。”杨传辉暗示。做为原生分布式数据库,OceanBase本来就具备企业级分布式数据库能力,为AI时代的海量数据处置阐发打下了根本。正在支撑AI使用落地的焦点根本设备——向量机能、夹杂检索等层面,OceanBase也正在持续摸索,进一步加强SQL+AI能力。大会现场,基于基准测试东西VectorDBBench,采用Performamce768D1M测试数据集,OceanBase取业内三款领先的开源向量数据库进行了机能跑分测试。成果显示,OceanBase的向量机能曾经达到开源向量数据库业内的领先程度。此外,OceanBase还引入了BQ量化算法(HNSW+BQ),大幅降低向量场景的内存需求;引入针对JSON半布局化数据的压缩能力,降低AI场景中的半布局化数据存储成本。按照测试成果,正在划一召回率取机能的环境下,引入BQ量化算法可以或许实现内存成本较引入前降低95%,而正在TPC-H 10G数据集上,OceanBase的JSON压缩比可达MongoDB的3倍。正在夹杂检索方面,OceanBase已具备面向多种数据模子的夹杂检索能力。正在最新版本中,OceanBase夹杂检索机能进一步加强,通过丰硕的施行策略、自研的向量算法库、内核级多模夹杂查询等实现更快、更准、更易用的夹杂检索。正在大会上,蚂蚁集团CTO何征宇暗示,蚂蚁集团将支撑OceanBase正在金融、医疗、糊口等蚂蚁AI的焦点场景的冲破,支撑OceanBase去实践Data×AI的和架构立异。同时继续支撑OceanBase开源,把正在Data×AI上的能力逐步给行业,为AGI的胡想添砖加瓦。这一许诺不只表现了蚂蚁集团对OceanBase的信赖和支撑,也展现了两边正在AI范畴的深度合做和配合愿景。过去十五年OceanBase降生于双11的海量买卖场景并正在蚂蚁集团的金融场景中磨砺打磨手艺,将来,蚂蚁集团也将继续向OceanBase焦点AI场景,实现开源,为行业供给更多的AI立异办事。目前,OceanBase已被客户使用于多个AI相关场景的开辟,如联通软研院基于OceanBase打制AI帮手,银泰贸易则基于OceanBase打制零售业智能问数平台等。这些案例不只展现了OceanBase正在AI范畴的现实使用价值,也为行业供给了贵重的经验和参考。