【资料图】
5月30日,在2023中关村论坛的人工智能驱动的科学研究论坛上,北京科学智能研究院、中国科学院计算机网络信息中心、墨奇科技(北京)有限公司联合发布了款基于大模型+向量检索引擎的文献知识库Science Navigator V1.0。
根据美国国家科学基金会统计数据,科研人员花费在查找和消化科技资料上的时间,需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。科研检索方式经历了眼查手翻的查阅式检索、基于互联网的搜索式检索阶段,将进入对话式检索阶段。
“但通过对话式大语言模型检索是有局限性的,比如幻觉与偏见、数据滞后、缓存限制”,墨奇科技副总裁孟卓飞总结,基于这些痛点,墨奇科技等提出大语言模型+向量数据库=下一代文献知识库的概念,整个知识库包括,以科研人员为代表的用户层、以GPT4等为代表的模型层、由向量数据库+搜索引擎组成的中间层、由文献和教材等支撑的数据层。北京科学智能研究院、墨奇科技、中国科学院计算机网络信息中心分别负责模型层、中间层、数据层。
据孟卓飞介绍,Science Navigator V1.0支持文本、图片、表格、公式跨模态识别处理,科研人员可选用文心一言、LLM等各种大小模型,实现问题解析最佳效果,第一批已收录化学、材料、AI等领域近百万篇论文,未来将扩展至自然、人文学科亿级文献存储。
(文章来源:北京商报)