当前播报:MathGPT 来了！专攻数学大模型，解题讲题两手抓

首页>焦点 > 正文

2023-05-08 13:21:53

来源：量子位

大模型领域又来新玩家。

据了解，学而思正在进行自研数学大模型的研发，命名为MathGPT。

(资料图片仅供参考)

面向全球数学爱好者和科研机构，以数学领域的解题和讲题算法为核心。

目前已经取得阶段性成果，并将于年内推出基于该自研大模型的产品级应用。

据悉，学而思已将 MathGPT 作为公司核心项目，由CTO 田密负责。

今年春节前，该项目已经启动相应的团队建设、数据、算力准备和技术研发。

此外，学而思已经启动在美国硅谷的团队建设，将成立一支海外算法和工程团队，在全球范围内招募优秀的人工智能专家加入。

MathGPT 与大语言模型（LLM）的差异

OpenAI 在今年三月份发布了大语言模型 GPT-4，国内百度、阿里也发布了各自的大模型产品，但通用语言模型更像一个 " 文科生 "，在语言翻译、摘要、理解和生成等任务上有出色表现，在数学问题的解决、讲解、问答和推荐方面则存在明显不足：

解答数学问题经常出错，有些数学问题虽然能够解决，但方法更偏成年人，无法针对适龄孩子的知识结构和认知水平做适配。

" 这种不足是由 LLM 模型的自身特点决定的。"

学而思 AI 团队负责人介绍，LLM 大模型来自对海量语言文本的训练，因此最擅长语言处理。

行业内偏向基于 LLM 大模型做阅读、写作类应用，但如果想要在数学能力上有突破，就需要研发新的大模型。

因此，学而思决心组建团队专研 MathGPT ——数学领域大模型，用自己在数学和 AI 上的多年积累，面向全球范围内的数学爱好者和科研机构，做好 AI 大模型时代的数学基础工作。

学而思希望通过 MathGPT 弥补和攻克大语言模型的三个问题：

第一，题目要解对，现在 GPT 结果经常出现错误；

第二，解题步骤要稳定、清晰，现在 GPT 的解题步骤每次都不一样，而且生成内容经常很冗余；

第三，解题要讲的有趣、个性化，现在 GPT 的解释过于 " 学术 " 和机械，对孩子的学习体验很不友好。

为了实现这些目标，MathGPT 将结合大语言模型和计算引擎两者的能力，大语言模型负责理解题目、分步解析，并在合适的步骤自行调用计算引擎，这样能提高题目解答正确率。

基于海量名师解题过程的数据进行模型训练，模型的解题步骤可以更加清晰。

再引入优秀老师的教学理念和方法，模型在解题趣味性上也能进一步提高。

据透露，MathGPT 将先从中小学数学做起，逐步覆盖全年龄学段和解题种类。

做 MathGPT，学而思凭什么

学而思作为获国家科技部批准的 " 智慧教育国家新一代人工智能开放创新平台 " 建设单位，也是教育行业唯一一家人工智能 " 国家队 " 成员，在人工智能领域有着多年的深入研究。

早在 2017 年，学而思便成立了 AI lab 人工智能实验室。

据公开信息显示，基于智慧教育人工智能开放创新平台助力，学而思 AI lab 获得各类顶级学术会议比赛冠军 16 项，亚军 6 项；

发表国际期刊和会议高水平学术论文 31 篇，包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究，在计算机视觉顶会以及自然语言顶会中均有多篇论文发表；

申请专利 220 余项，授权专利 150 余项，软件著作权 60 余项。

△学而思 AI lab 在各类顶级学术会议比赛获奖情况

" 以数学起家 " 的学而思至今已有 20 年的数学教学经验，积累了庞大的数学相关数据，这些数据是进行 MathGPT 训练的必备物料。

另外，学而思的海外业务 Think Academy 在全球若干国家和地区深受数学爱好者喜欢，学而思的学生在每年的 IMO 和 AMC 等国际数学竞赛中表现优异，每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

所以，学而思选择在 MathGPT 方向发力也顺理成章。

今年 2 月，学而思学习机上线 AI 讲题机器人小 π。

据了解，小 π 研发已有数年积累，研发方向主要为数学等领域的 AI 智能讲题能力，核心优势在于数理逻辑和运算。

在实测中，当学而思学习机用户配套的 AR 镜识别到一道手写或者印刷的数学计算题时，小 π 机器人会对题目进行智能 AI 拆解分析，同时生成逻辑流畅、表达清晰的语言，将题目的解题方法讲解出来。

该功能已覆盖的题目包括分数、小数等复杂计算，甚至一些 " 凑数、组合 " 的巧妙算法，已十分接近真人老师的解题效果。

△同一道数学题目在 ChatGPT ( 上 ) 和小 π（下）的解答对比

小 π 相关技术于 2020 年启动研发，以学而思超 3 亿的专业题库数据作为基础，经过了 3 年的数据训练和打磨迭代。

另据了解，学而思学习机近期将会上线一款 "AI 助手 "，涵盖作文助手、口语助手、阅读助手、数学助手等相关功能，该 AI 产品将于 5 月 11 日开启内测。

MathGPT 的挑战和技术难题

如何利用大语言模型服务各行各业是当下社会的焦点问题。

大模型的出现是对生产力和生产关系的改变，各行各业都会受到影响，并会在大模型的助力下完成转型升级。

教育行业和大模型有着天然的契合点。教育也是通过交流，把知识和信息传递给学生，大模型会让教育行业的数字化、智能化速度更快。

比如在教育领域，Duolingo、Quizlet、可汗学院等产品主要和 OpenAI 合作，在 GPT 大模型上做微调和接口调用，增强原有的产品体验。

但也有一些领域如数学、医学等，对 AI 的需求是准确、清晰、具备强大的逻辑推理能力，且容错率低，通用 LLM 目前的性能表现还无法在上述领域取得突破，未来是否可能取得突破尚不清晰。

以数学领域为例，目前市场上有几个主要流派。

比如 Google 收购的 Photomath、微软数学、Mathway、专注数学计算的 WolframAlpha 等产品，主要利用非 LLM 的传统 AI 技术加上数据库的方式解决数学问题。

走 AGI 路线的公司则尝试让通用 LLM" 更懂数学 "，比如 GPT4 在数学任务上比之前的 3.5 版本性能更好，谷歌旗下的 Minerva 模型也专门针对数学问题进行调优。

学而思选择了另一条少有人走的路，不基于现有 LLM 做微调和接口调用、不做通用 LLM，而是自研基于专业领域的 " 数学大模型 "MathGPT，致力于打造自主、稳定、可持续、高质量的学习解决方案。

学而思表示，乔布斯对电脑的定义是 " 思维的自行车 "，MathGPT 面向全球的数学爱好者，希望能成为学习数学、思考数学的 " 自行车 "，帮助人们更好的解决学习数学、思考数学的问题。

长远看来，数学思维代表着理性逻辑，是 " 思维的体操 "，是一种基础能力，能够与很多行业产生关联。

未来，也许每个人都是程序员，用自然语言就可以编程，创新想法，与人协作，创造新事物，但是用自然语言编程的好坏很大程度取决于是否经过数学思维的训练。我们希望通过 MathGPT，帮助每个人更好地建立理性逻辑，从而终身成长，推动社会进步。

在大语言模型不断进化的浪潮下，不同的技术路线选择孰优孰劣，仍有待讨论和验证。

学而思自研独立的 MathGPT 大模型是否成立，是否能够超越通用模型在数学任务上的表现，是否更匹配不同人群的数学学习场景，这个问题还需要在创新实践中寻找答案。

随着整个行业的深化发展和越来越多人才参与到这个领域，相信不久的将来就能看到更为成熟的解决方案。

* 本文系量子位获授权刊载，观点仅为作者所有。

— 完—

量子位 QbitAI

" " 追踪 AI 技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

标签：

THE END

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表热讯制鞋网的观点和立场。

相关热点

针对密室逃脱、剧本杀上海将实施备案管理

新华社电上海市文化和旅游局近日发布《上海市密室剧本杀内容备案管理规定（征求意见稿）》，并截至12月8日面向社会公众广泛征求意见。这

2021-11-19 13:46:03

备战2022 基金经理调仓换股布新局

《中国证券报》17日刊发文章《备战2022 基金经理调仓换股布新局》。文章称，距离2021年结束仅剩一个多月，基金业绩分化明显。部分排名靠前

2021-11-19 13:46:03

注意！三部门发文：将ETC欠费行为纳入征信体系

交通运输部办公厅中国人民银行办公厅中国银行保险监督管理委员会办公厅关于进一步做好货车ETC发行服务有关工作的通知各省、自治区、直

2021-11-19 13:45:58

从10月份市场供需积极变化看中国经济韧性

新华社北京11月17日电题：从10月份市场供需积极变化看中国经济韧性新华社记者魏玉坤、丁乐读懂中国经济，一个直观的视角就是市场供需两端

2021-11-19 13:45:58

如何提高教育经费使用率

全国教育财务工作会议披露的消息称，2020年，中国国家财政性教育经费投入达4 29万亿元，占GDP总量的4 206%，我国国家财政性教育经费支出占G

2021-11-19 13:45:48

“种草平台”变“韭菜地” 好物分享为何变了味

如果你也热爱“种草”，前方高能预警！让你心心念念、“浏览”忘返的网络平台，可能早已成为一块块“韭菜地”。近日，据《半月谈》报道，有...

2021-11-19 13:45:48

工信部描绘未来5年信息通信业发展趋势

日前，工业和信息化部印发《“十四五”信息通信行业发展规划》（以下简称《规划》），描绘了未来5年信息通信行业的发展趋势。《规划》指出...

2021-11-19 13:45:40

快递业务旺季，保质保量战高峰

本报讯（中青报·中青网记者周围围）2021年快递业务旺季正式拉开帷幕。国家邮政局监测数据显示，仅11月1日当日，全国共揽收快递包裹5 69

2021-11-19 13:45:40

第七批中国援柬埔寨新冠疫苗抵达金边

人民网曼谷11月17日电（记者赵益普）17日上午，中国援柬埔寨第七批200万剂科兴新冠疫苗抵达金边国际机场。当天，柬埔寨政府在机场举行了

2021-11-19 13:45:35

用废弃盐穴打造绿色“充电宝”

金坛压缩空气储能国家试验示范项目主体工程一角受访者供图依托清华大学非补燃压缩空气储能技术，金坛压缩空气储能项目申请专利百余项，建立

2021-11-19 13:45:35

“煤老大”再显底气山西煤、电、气协同发力保供应

视觉中国供图42亿立方米据有关部门预计，今年山西煤炭产量有望突破12亿吨，12月份山西外送电能力将超过900万千瓦，今冬明春煤层气产量将达4

2021-11-19 13:44:34

14省份发布2021年企业工资指导线向基层劳动者倾斜

14省份相继发布2021年企业工资指导线——引导企业合理提高职工工资今年以来，天津、新疆、内蒙古、陕西、西藏、山东、江西、山西、福建、四

2021-11-19 13:44:34

“药业大佬”一审被判12年，还需赔股民24.59亿

中新网客户端北京11月18日电 (记者谢艺观)“一条路海角天涯，两颗心相依相伴，风吹不走誓言，雨打不湿浪漫，意济苍生苦与痛，情牵天下喜

2021-11-19 13:44:31

三部门：ETC欠费行为将纳入征信体系

近日，交通运输部等三部门发布《关于进一步做好货车ETC发行服务有关工作的通知》。通知提到，对不具备授信条件的用户，商业银行可在依法合

2021-11-19 13:44:31

欧莱雅面膜陷优惠“年度最大”风波

欧莱雅面膜陷优惠“年度最大”风波涉及该事件集体投诉超6000人次美妆大牌双十一促销翻车？近日，因预售价格比双十一现货贵出66%，欧莱雅

2021-11-19 13:44:13

调查：43.6%受访者会考虑跳槽

43 6%受访者会在工作两三年后考虑跳槽54 3%受访者认为跳槽对个人职业发展有利有弊如今对不少年轻人来说，想对一份工作“从一而终”不太容易

2021-11-19 13:44:13

超八成受访青年表示如有机会愿意开展副业

超八成受访青年表示如有机会愿意开展副业规划能力最重要64 4%受访青年指出做副业跟风心态最要不得如今，“身兼数职”已成为年轻人当中的

2021-11-19 13:44:01

我国对新能源产业发展非常重视发展氢能正当其时

发展氢能正当其时【科学随笔】氢能是一种二次能源，它通过一定的方法利用其他能源制取，具有清洁无污染、可储存、与多种能源便捷转换等优点

2021-11-19 13:44:01

“千杯不醉”的解酒“神药”能信吗？专家释疑

“千杯不醉”的解酒“神药”能信吗？专家：网红“解酒药” 其实不算药俗话说，“酒逢知己千杯少”，酒一直是国人饭桌上至关重要的存在。尽...

2021-11-19 13:43:57

当前播报:MathGPT 来了！专攻数学大模型，解题讲题两手抓

相关热点

最新文章

相关推荐

针对密室逃脱、剧本杀上海将实施备案管理

备战2022 基金经理调仓换股布新局

注意！三部门发文：将ETC欠费行为纳入征信体系

从10月份市场供需积极变化看中国经济韧性

如何提高教育经费使用率

“种草平台”变“韭菜地” 好物分享为何变了味

当前播报:MathGPT 来了！专攻数学大模型，解题讲题两手抓

相关热点

最新文章

相关推荐

针对密室逃脱、剧本杀 上海将实施备案管理

备战2022 基金经理调仓换股布新局

注意！三部门发文：将ETC欠费行为纳入征信体系

从10月份市场供需积极变化看中国经济韧性

如何提高教育经费使用率

“种草平台”变“韭菜地” 好物分享为何变了味

针对密室逃脱、剧本杀上海将实施备案管理