NTT推出日语优化AI模型tsuzumi2,30B参数,40GB显存即可运行,提升日语处理能力。
10月21日,日本NTT宣布于当地时间20日推出优化后的轻量级AI模型tsuzumi2,该模型专为日语环境设计。这款拥有30B参数的模型在推理过程中仅需约30GB内存,单张A100显卡(40GB容量)即可满足需求,便于在本地或私有云环境中部署,从而确保敏感信息的安全性。
NTT于2023年推出了定位相似的初代tsuzumi模型,此次tsuzumi2的推出是基于政企用户在实际使用初代tsuzumi后,对模型在处理复杂文档和应对专业领域知识方面提出更高要求的结果。
NTT宣称,tsuzumi2在日语环境中展现出与同类参数规模模型相比一流的性能;通过引入RAG(检索增强生成)技术以及微调,tsuzumi2在金融、医疗和公共领域等应用场景中表现更为出色,对NTT自身的业务而言,其效果甚至超越了GPT-5。 从行业角度来看,tsuzumi2的推出不仅体现了日本企业在大模型领域的技术实力,也反映出其在垂直领域深度优化的能力。尤其是在金融和医疗这类对准确性要求极高的领域,结合RAG与微调的技术路径,能够有效提升模型的实际应用价值。这为后续类似模型的发展提供了可借鉴的方向,同时也增强了本土企业在人工智能竞争中的话语权。