C114通信网  |  通信人家园

人工智能
2023/10/26 15:31

Jina AI推出全球首个开源8K文本嵌入模型,号称“超越 OpenAI”

IT之家  漾仔(实习)

Jina AI 在其官网发布新闻稿,宣布推出 jina-embeddings-v2 模型,号称是目前是唯一支持 8K(8192 个 token)上下文长度的开源产品,在功能和性能上与 OpenAI 的 text-embedding-ada-002 类似。

在大规模文本嵌入基准 (MTEB) 排行榜方面,官方进行如下解释:

与 OpenAI 的 8K 模型 text-embedding-ada-002 进行比较,jina-embedding-v2 在分类平均值、重排平均值、检索平均值和摘要平均值方面均优于 OpenAI 的 text-embedding-ada-002。

  ▲ 图源 Jina AI 官网

  ▲ 图源 Jina AI 官网

官方表示,jina-embeddings-v2 模型,是从头开始构建的。在过去的三个月里,Jina AI 团队进行了密集研发、数据收集和调整。

Jina AI 同时声称, jina-embeddings-v2 8K 的上下文长度有利于以下应用场景:

法律文件分析:确保对大量法律文本中的每一个细节进行捕捉和分析。

医学研究:为了进行高级分析和发现,全面地嵌入科学论文。

文学分析:深入研究长篇内容,捕捉微妙的主题元素。

财务预测:通过详细的财务报告获得卓越的洞察力。

会话式 AI:提升聊天机器人对复杂用户查询的响应能力。

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141