首页>检索页>当前

南京理工大学团队发布人文社会科学领域学术大语言模型“兰章”

发布时间:2026-05-14 作者:阿妮尔 杜建宾 来源:中国教育新闻网

中国教育报-中国教育新闻网讯(记者 阿妮尔 通讯员 杜建宾)日前,南京理工大学(以下简称“南理工”)沈思教授团队开源发布人文社会科学领域学术大语言模型“兰章”,这标志着南理工在“AI+人文社会科学”知识体系构建方面迈出重要一步。

据悉,“兰章”凭借百亿词元的坚实数据基础以及两阶段深度优化训练,较好地解决了当前通用AI工具在人文社科全文本挖掘、复杂概念和论证逻辑理解方面的“盲域”和“幻觉”问题,不仅可以辅助用户系统地获取和梳理海量学术资源,还能够帮助人文社会科学领域学者总体评价既有成果并敏锐发现新学术研究契机。

“兰章”研发团队历时5年,构建了总规模116亿词元的人文社会科学学术语料库,涵盖CSSCI(中文社会科学引文索引)、CNKI人文社科期刊、人大复印报刊资料、教育部人文社科获奖著作全文(1992—2025年)等中文学术资源以及SSCI(社会科学引文索引)、A&HCI(艺术与人文科学引文索引)期刊摘要及Project MUSE、Project Gutenberg(1992—2025年)等学术资源,保证学科均衡覆盖及期刊与著作的深度集成。凭借百亿级词元的坚实数据基础,“兰章”较好解决了通用AI工具主要依靠论文标题、摘要等简单信息挖掘语料,难以理解完整文本中复杂概念和论证逻辑的难点痛点问题。经过深度优化训练,其表现显著优于多款通用模型,有效解决跨语言环境下低频专业术语的识别盲区问题和学术文本生成中的逻辑碎片问题,图书自动分类准确率比通用模型高出30%。

“大模型不是代替学者思考,而是立足实际学术研究,把自主知识体系的构建延伸到模型化和计算化的层面,从工具层面为人文社会科学学术创新提供持续支持。”沈思介绍说。目前,“兰章”已上线魔搭社区试运行,15697条训练指令数据已全部开源共享。

0 0 0 0
分享到:

相关阅读

最新发布
热门标签
点击排行
热点推荐

工信部备案号:京ICP备05071141号

互联网新闻信息服务许可证 10120170024

中国教育报刊社主办 中国教育新闻网版权所有,未经书面授权禁止下载使用

Copyright@2000-2022 www.jyb.cn All Rights Reserved.

京公网安备 11010802025840号