9月19日,中国科学院地理科学与资源研究所携手中国科学院青藏高原研究所、中国科学院自动化研究所等机构,共同发布了名为“坤元”(Sigma Geography)的多模态地理科学大模型。这一专为地理科学领域设计的语言大模型,具有解决地理科学问题的专业技能,其开发涵盖了地理学全面语料库的构建、专业语言大模型的建立,以及地理科学研究智慧辅助平台的开发。这让“坤元”不仅能够理解地理知识,还能精准匹配图像、理解用户需求并自动生成图表,服务范围从解答地理专业问题到地理文献智能分析,再到地理数据查询与分析,乃至专题地图绘制等。
研发团队构建了一个包含四大类别、十六小类的全方位地理学科语料库,为大模型提供了320亿词元进行自我学习,并精心调整了超过4万条高质地理学指令。与通用语言模型相比,“坤元”在地理学特定语言模式、术语及专业知识的理解上更为精准,其在地理学专业测试中的准确度提高了31.3%。
“坤元”的目标是拓宽公众的地理认知边界,提升地理专业人士的工作效率,促进地理智能化的发展,为地理科学研究提供新动力,加速重要地理科学发现的进程。展望未来,研发团队正致力于地图大模型及地理推理机的研究,以实现模型直接解析地图的能力;同时,他们还计划开发一个地理科研合作大平台,使每位科学家和研究团队都能拥有定制化的地理大模型,通过共享资源与智慧,与全球数百万科研人员协同创新。