Mistral发布以阿拉伯语和文化为重点的地区AI模型
大型语言模型 (LLM) 是支撑生成式人工智能工具蓬勃发展的关键技术之一,它的下一个前沿可能是地理位置。 本周一,总部位于巴黎的人工智能初创公司Mistral发布了一个与其通常的 LLM 有点不同的模型。
这款新的自定义训练模型被命名为 Mistral Saba,旨在解决特定地域的问题: 阿拉伯语国家。 Mistral Saba 的目标是在阿拉伯语互动中表现出色。
Mistral Saba 是一个相对较小的模型,拥有 240 亿个参数。 需要提醒的是,参数越少,性能越好,延迟越低。 但更多的参数通常意味着更聪明的答案,尽管这不是线性相关。
Mistral Saba 的大小与Mistral Small 3(其通用小型模型)相当。 但是,根据 Mistral 自己的测试,Mistral Saba 在处理阿拉伯语内容时的表现要比 Mistral Small 3 好得多。
一个有趣的效用是,由于中东和南亚之间的文化交流,Mistral 认为 Saba 还能很好地处理印度语,尤其是南印度语,如泰米尔语和马拉雅拉姆语。
对于这家法国人工智能巨头来说,推出这种新模型是一个有趣的战略举措,表明其更加关注中东地区。 Mistral 公司表示,它希望这种模式能帮助它在该地区的客户中获得吸引力。
作为现成的模型,Mistral Saba 可用于阿拉伯语对话支持或内容生成,听起来更自然、更贴切。 该公司表示,它还可以作为一些微调模型的基础,用于内部用例。
TechCrunch Disrupt 2025
Disrupt 2025 将在您意识到之前到来! 现在就以全年最低价购买门票。 从人工智能和初创企业到太空、金融科技和首次公开募股--通过五个主舞台、分组讨论、圆桌会议、无与伦比的人际网络以及更多活动,体验改变游戏规则的真知灼见。
加利福尼亚州旧金山| 10 月 27-29 日
上周,Mistral利用AI行动峰会展示了它正在认真开展业务。 虽然 Mistral 已经从国际投资者那里筹集了大量资金,但其许多外国支持者都在美国,如光速创投(Lightspeed Venture Partners)、安德森-霍洛维茨(Andreessen Horowitz)和 Salesforce Ventures 等。
由于地缘政治格局的变化,该公司有可能在即将到来的新一轮融资中迎来中东投资者。 这将是一种筹集更多资金的方式,以便在技术层面上继续参与人工智能竞赛,并将自己定位为美国和中国人工智能公司的国际替代者。
Mistral 的最新模型 Saba 可以为这一潜在的筹资努力做出贡献。
Mistral Saba 可通过 Mistral 的 API 访问。 它也可以部署在企业内部,这对于从事能源、金融或医疗保健等敏感行业的公司来说可能是一个强有力的卖点。
由于该公司的欧洲根基,自最初的开放式 Mistral 7B 型号发布以来,该公司就经常重申其非常重视多语言支持。 Saba 的发布是这一定位的延续。 该公司表示,今后将把注意力转向其他地区语言。