Jina AI 推出全球首个开源 8K 文本嵌入模型,号称超越 OpenAI
发布时间:2023-10-26 16:30:09来源:
10 月 26 日消息,Jina AI 在其官网宣布新闻稿,发布推出jina-embeddings-v2模型,号称是目前是唯一支撑8K(8192个 token)上下文长度的开源产品,在功效和性能上与OpenAI的text-embedding-ada-002相似。
在大规模文本嵌入基准(MTEB)排行榜方面, 发现,官方进行如下解释:
与OpenAI的8K模型text-embedding-ada-002进行比拟,jina-embedding-v2在分类平均值、重排平均值、检索平均值和摘要平均值方面均优于OpenAI的text-embedding-ada-002。
▲ 图源 Jina AI 官网
▲ 图源 Jina AI 官网
官方表现,jina-embeddings-v2 模型,是从头开端构建的。在过去的三个月里,Jina AI团队进行了密集研发、数据收集和调剂。
Jina AI同时声称,jina-embeddings-v28K的上下文长度有利于以下使用场景:
法律文件剖析:确保对大批法律文本中的每一个细节进行捕捉和剖析。 医学研讨:为了进行高等剖析和发现,全面地嵌入科学论文。 文学剖析:深刻研讨长篇内容,捕捉奥妙的主题元素。 财务预测:通过详细的财务报告获得卓著的洞察力。 会话式AI:晋升聊天机器人对庞杂用户查询的响应才能。
(责编: admin)
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。