浪潮NF5568M4落地猿题库 让机器老师更智能

简介:

近年来人工智能开始真正进入了人们的生活,开始与各行业应用融合,并让原有的应用更高效、更智能。比如在在线教育行业,"小猿搜题"运用浪潮NF5568M4 GPU服务器将其线下模型训练时间提升5-6倍,让老师从重复性的试题解答中解放出来。

随着计算能力的提升和数据量的积累,近年来人工智能开始真正进入了人们的生活,开始与各行业应用融合,并让原有的应用更高效、更智能。有人甚至扬言,人工智能在不远的将来将会取代一部分人的工作。其实,目前来看,人工智能在现阶段的主要目标是把人们从重复性、可量化的工作中解放出来,类似于机器代替人手,只不过这次技术变革是将人脑从简单重复工作中释放。

浪潮NF5568M4落地猿题库 让机器老师更智能

小猿搜题,以人工智能方式升级在线教育模式

人工智能让机器也成为"老师"

就像目前教育行业也在越来越多的运用人工智能,比如在线教育App"小猿搜题",如果你有不会的题目,通过手机拍照上传,不论是印刷体还是手写体,都能被机器识别,并与后端的题库进行快速匹配,在短短数秒钟得出详细的解答。

要知道,原来每个老师最多也就对应几十、一百多点的学生,而现在在线教育所面向的手中又何止千万,已经远远超出老师人工解答的极限,因此"小猿搜题"这种人工智能+教育的形式,极大地解放了老师对于重复性问题的解答,同时也让学生们能够最快捷地得到最准确的解题思路。

浪潮NF5568M4落地猿题库 让机器老师更智能

机器已经可以轻松识别手写字体

"AI老师"背后是海量数据的计算

让机器能够快速、准确的回答问题需要几步?首先,机器需要认字,不仅是汉字,还包括英文字母、英文单词、数学中常用的符号等;其次,机器在看到文字之后能够快速的识别、辨认,并将题目转化为可以被机器匹配的数据;最后将这部分数据与后台海量的数据库进行匹配,找到其中的完美匹配项,并将这个匹配项所对应的答案进行输出。从中可以看出,机器的认字和识别,正是人工智能应用中最常被用到的图像识别的一种,前者需要通过数以亿计的样本训练来创建相应的模型,而后者则是根据模型定义的特征识别出文字、符号。

由于每个人的手写习惯不同,识别手写体成为了图像预处理和切分之后首先要面临的挑战,通过大量的样本找到手写习惯的共同特征,如习惯向右倾斜着写或者中文之间没有空格等。更复杂的是数学题的识别,因为数学题目中有大量的复杂公式需要识别,比如根号、分式、上下标的各种组合。这不仅要进行正确的切分,还需要有合理的匹配识别。解决以上两个问题都需要用到深度学习,通过构建卷积神经网络或者递归神经网络,将大量的数据源通过神经网络法计算之后得到符合需求的模型,为最终的使用提供服务。

浪潮AI计算力,让小猿搜题效率提升6倍

不论是创建何种神经网络,都需要对海量样本进行分析,因此对于后端服务器的计算压力极大。因此采用GPU等协处理计算设备来加速人工智能应用成为主流,在线下模型训练中通常会采用核数更多、并行计算能力更强的GPU服务器,而在线上推理应用中可以采用FPGA这种轻量级的计算加速设备。

浪潮NF5568M4落地猿题库 让机器老师更智能

浪潮NF5568M4 GPU服务器

由于手写字体差异极大,需要大量的模型训练任务,因此"小猿搜题"的技术团队选择浪潮NF5568M4 GPU服务器来加速业务的快速上线。浪潮NF5568M4采用Intel最新Haswell处理器与GPU加速计算技术的协同,CPU主要承担其更擅长的逻辑选择、判断跳转和IO通信方面的职责,而GPU则专职计算密集型、高度并行的计算工作,使得计算资源合理的分配,计算力被充分释放,计算性能达到从几倍到几十倍的增长。NF5568M4在4U空间内配备双路E5-2600v4CPU和4块GPU卡,单机最高单精度浮点计算能力可达每秒40万亿次,将能极大的提升"小猿搜题"海量样本的处理效率。

而在存储方面,GPU计算每天会产生大量的数据,所以存储空间需要保证单机10TB以上。但是由于这部分数据数据属于缓慢写入,并不需要太高的IO,所以采用大容量SATA硬盘来支持就足够满足。NF5568M4支持8块3.5寸硬盘,并通过配置高速的阵列卡,使计算集群拥有500MB/s左右的IO吞吐,足以满足"小猿搜题"线下模型训练应用需求。

通过合理的计算硬件选型,"小猿搜题"在线下模型训练时可以将训练时间提升5-6倍,而线上预测速度也得到2-4倍的提升,再经过语言模型的纠错,小猿搜题最终实现题目拍照之后"秒懂你的心"的效果。

目前,浪潮人工智能相关解决方案在国内主流AI领域的占有率超过80%,为百度、阿里巴巴、腾讯、奇虎、搜狗、科大讯飞、今日头条、Face++等领先企业提供基于GPU/FPGA/KNL等协处理加速服务器和caffe-MPI等软件、算法优化服务,加速中国人工智能应用的发展。


原文发布时间为:2017年5月18日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
4月前
|
消息中间件 存储 缓存
后端工程师求职实录:二线城市就业攻略与心得分享
后端工程师求职实录:二线城市就业攻略与心得分享
|
4月前
|
设计模式 算法 网络协议
励志!一年时间,从小白到进入阿里核心部门,“他”的逆袭之路
注明:这是一个励志老哥给我分享的个人经历,发本文的目的是为了让大家可以参考他的学习经历,提高自己的能力!当然人外有人天外有天,大神也别打我!再次说明,我只是为了能够帮助迷茫的兄弟们!接下来以他的第一视角为大家讲述他的经历。
|
4月前
互联网行业常见岗位工作内容及发展前景介绍——【大学生就业训练营】系列第二课
系列课程共有八节,下方完成视频课程观看并在评论区回复学习心得,还可以领取惊喜礼品~
432035 1640
|
4月前
|
监控 架构师 程序员
阿里技术专家撰写程序员“不迷茫”职业路指南,切中痛点规划未来
我一直都是一个“笨孩子”,但我不以笨为耻。小学三年级时要写一篇关于柑橘树的作文,那时自己肚子没货、下笔万难,父亲知道后教了我两招:是从 整体到局部观察事物;二是阅读,看看别人是怎样写的。
|
6月前
|
消息中间件 架构师 算法
好家伙!全网开源对标P5~P7程序员技术成长路线,阿里这次是真卷
今年的程序员可以说是最焦虑的一个群体了,面试找工作投简历没人理,有面试机会也面试不过,面试进去还干不长...于是,程序员们纷纷直呼:互联网寒冬又双叒叕来了,环境不好努力也没用躺平算了。
159 1
好家伙!全网开源对标P5~P7程序员技术成长路线,阿里这次是真卷
|
安全 算法 大数据
大咖授课+项目实战+工作offer,2022数据智能夏令营火热招募中!
中国(温州)数安港特面向高校学生及社会青年人才发起“数据智能夏令营”活动,通过提供全方位、沉浸式学习课程和实践机会,挖掘、培育更多“高精尖”数据技术人才,为数据智能领域创新发展注入新力量。
189 0
大咖授课+项目实战+工作offer,2022数据智能夏令营火热招募中!
|
人工智能 算法 前端开发
阿觿学长带领准大学生们一起走进互联网
Hello,大家晚上好,我是阿觿学长。阿觿学长带领大家走进互联网。 在我们正式开始之前呢,我们先看一下下方的图片,这是一张关于近几年高校毕业生人数的图片,相信每年到了就业季大家都会听说:“今年是最难的就业季”,确实每一年高校毕业生人数都在逐年增加今年更是突破千万,达到了1076万人,这就是为什么每年都要比前一年更难就业。 随着我国高等教育的普及以及人们对于教育的重视,上大学已经变得越来越简单,不论分数高低,都会有适合自己的高校,而这一现象就造成了高校毕业生数量急剧增多,本科学
216 1
阿觿学长带领准大学生们一起走进互联网
|
Linux Python
感谢阿里云飞天计划,让我有接触服务器机会。使自己的认知得到提高,还要说一下在配置服务器的闲空中我发现阿里云还有一个用户论坛,里面都是从事这种行业,和喜欢这方面知识的人,从中我也能学习到很多东西。我相信凭我自己的努力我一定能,成为我想成为的那种人。
感谢阿里云飞天计划,让我有接触服务器机会。使自己的认知得到提高,还要说一下在配置服务器的闲空中我发现阿里云还有一个用户论坛,里面都是从事这种行业,和喜欢这方面知识的人,从中我也能学习到很多东西。我相信凭我自己的努力我一定能,成为我想成为的那种人。
|
机器学习/深度学习 人工智能 算法
你不用理解AlphaGo 也不需要懂大数据,等着收获惊喜就够了
你不用理解AlphaGo 也不需要懂大数据,等着收获惊喜就够了
你不用理解AlphaGo 也不需要懂大数据,等着收获惊喜就够了