黄金城vip娱乐官网-专访考拉阅读CEO赵梓淳:用AI打造中国的“蓝思标准”

泡沫雕刻机 | 2020-12-12

黄金城最新娱乐网站

黄金城最新娱乐网站|最近,专注于中文分级读者系统的考拉读者宣布2000万美元b轮融资完成,距去年12月a轮融资已经9个月了。 关于a回合以后的最新进展,赵梓淳回答,考拉读者的App总日活量已经增加到接近一百万人,平均日停留时间为30分钟,第二天和第二周的残存率在70%以上,产品半年发布26次。 回到考拉读者北京办公室,采访了考拉读者首席执行官赵梓淳。

中文级读者的难题在哪里? 分级读者有几百年的历史,在欧美比较普及。 在中国引进分班读者的时间也不短,但中国仅次于美国,就像中文网上和其他公司一样,基本上停留在书信形式上,根据学生的年级和年龄区分书信这一点。

“但是,确实的分级读者必须像欧美一样,根据学生读者的能力给予。 通过对读者进行分类来解放读者,让孩子寻找适合自己的东西。 但是,为什么至今为止没有像我们这样做的人,下一个课题是科学地区别中文文本的可玩性的测定,即文本的可玩性的水平。

”。 首先,中文和英语没有足够的区别,与西方印欧语系繁杂的格表记语法系统不同,中文语法灵活性高,意思非常简单。 英语的基础构成单位为26个文字,中文的构成单位为字,常用汉字约为3500个文字。 《康熙字典》中收录的汉字约为8万到10万个汉字,这样简单包含的稀缺性在分析中文时往往不需要更大的词汇。

第二,现代汉语历史很短,中国学者、专家、中国对汉语、语言学的一些积累和溶解很少,确实开展科学化的一些研究时间不广,文化基础也太多。 第三,分级读者还涉及数据挖掘、语言学、测量心理学、读者测量学等各学科的同步。 最后,更重要的是在深入自学被广泛应用之前没有解决问题的技术。

十年前或二十年前的技术只不过不太能解决问题当时面临的这个问题。 比如,美国的布鲁斯班,主要使用语言学家的传统统计学,所以只不过用了不太高级的技术。 中文读者的等级希望达到规模化的解决方案不能依靠现代科学技术的发展。

考拉的读者用了两年时间构建了仅次于世界的中文分层基础语料库,融合了以语言学、测量心理学、深神经网络为代表的尖端AI算法解决了问题。 “我们邀请了多年参加教育研究的专业学者和经验丰富的教育专家参加玩耍性判别和标准制定,通过了数万件文本测试,发现准确度超过了93%左右。

》AI司机自学系统的图像来源:考拉读者App接口考拉读者的产品是学生终端、教师终端App和考拉家长微信小程序。 有两个特征。

一个是游戏化。 “我们最初制作考拉的读者产品时,把海外产品混合起来,做得更坦率,缺乏游戏和动画的颜色。

但是,不久,坦率的产品对中国学生没有吸引力,小学生还是讨厌游戏简化的东西,然后根据调整,引进了优酷少儿的设计师,使UI整体和孩子的适合度更低。 》试试考拉的读者学生终端App。 主界面的第一栏是“短文星”游戏。 第二排“寻找世界”是ER值不同的读者文本。

第三排“听讲广播”是与喜马拉雅合作的语音栏。 第三栏是组词合格游戏,第四栏变更为显示ER值的故事文本。 另外,还有童话岛、每天早上读、书籍主题、同学热读、书籍海洋等读者栏。

第二个是AI司机。 “我们正在将基础AI算法应用于产品级别。 这个算法类似于今天的顶部,但今天的顶部是内容部署算法,无论是交叉参考还是用户图像,根据兴趣参考用户不喜欢的内容。

黄金城最新娱乐网站

我们的推荐算法是根据学生读者的能力给出的,使用频率越多推荐的精度越高。 “图片来源:考拉的读者说:“中文比英语简单多了,机器在解读中文的第一步不会遇到词性分析、语言模型上的困难。 因此,制作现在流行的AI技术,如RNN、LSTM等深度自学技术,可以填补中文NLP上的缺陷。

我们不根据句法树、依存关系等废弃一个句子,分析各成分在句子中的比重,构建读者文本的可玩性等级。 》考拉的读者处理了1300万个不均衡语料库和2亿个不均衡语料库。 其中,不平衡语料库主要来自各版本的小学教材及其教学辅助资料。

均衡语料库是指10岁孩子必须读20%的名作小说、50%的文本、20%的漫画的比例,是孩子在日常生活中必须现实认识的词汇。 考拉读者的人工智能主要应用于建立基础等级标准之外,学生基层App不根据学生读者的能力自动推荐合适的内容的自适应自学系统。

谈谈现在的热适应自学,赵梓淳回应,适应自学不要被高估了。 基于科学知识图谱的适应自学有一定的意义,可以防止学生反复执行已经控制的主题,节约时间提高效率。

老实说,没有多少政治宣传。 另外,考拉的读者也正在开展智能语音产品的开发,可以通过语音输入测试学生的普通话标准的程度。

建立中国《蓝思标准》海外分级读者标准体系已经到了成熟期,如培养公司推出的测定少儿英语读者能力的DRA (developmentalreadingassessment )发展性读者评价系统。 英国Renaissance Learning公司开发的AR(Accelerated Reader )等级系统。 还有有名的青思读者项目管理系统(The Lexile Framework for Reading )。

这个系统是美国Metametircs教育公司经过15年的研究开发的,美国青思的机构遍及50个州,复盖了全国学生人数的约50%。 布鲁斯读者项目管理系统依赖于读者的玩耍性和读者的能力两方面,用于同样的测量尺度,因此读者可以根据自己读者的能力,自由选择适合自己的读物。

可玩性的范围是0L~1700L,数字越小,读物的可玩性越低,或者读者的能力越低。 相反,读物的可玩性越高,读者的能力就越高。

主要从两个维度依赖于读物的可玩性,即语义可玩性和句法可玩性。 考拉读者推出的中文级读者标准(ER Framework )吸收了海外“语言、短语”的分析思想,测定方法也非常接近布鲁斯。 (ER是考拉读者品牌所属公司享受科学技术的英文名Enjoy Reading的简称。

图像来源:考拉读者获得,另一方面,对给定的中文文本从200ER到1300ER进行了测量,以10为十进制。 另一方面,使用心理学、读者测量学、语言学的方法,测定人的读者能力,即200ER到1300ER,以10为十进制。

“如果孩子测量了600ER读者的能力,有必要看能玩多少的文本吗? 600还是610? 我们明确提出ZPD (Zone of Proximal Development )的概念,整合了有名的心理学家威戈斯基明确提出的“最近的发展区”,即能力范围内可获得的区间。 不要总是做非常简单的事。 但是,特别是做徒劳的事,会长期失去自信。 ”。

黄金城vip娱乐官网

“比如600ER的孩子们,我们做了很多实验。 她/他的ZPD范围约为550到700。

这个区间显示,孩子查找文本的解读度在50%到59%之间,不仅因为文本太难而无法阅读,而且文本非常简单,接近新的内容。 “图片来源:考拉读者App图片的明确测试方式,赵梓淳解释说,用手机开展约3分钟的测试,可以测量学生的读者水平。 关于商业模式,“现在主要与公立学校合作,已经在二三线城市的约万所小学落地。 未来一定是ToC,但现在没有任何尝试,学生、老师和家长可以免费使用。

我们现在只是为利益着想,扩大规模。 如果说中国的小学生最后需要用ER值密切关联自己的读者能力,那么所有人都用ER值密切关联文本的玩耍性,这是相当大的机会。 “我们打算明年发表整个基础标准。 使用的算法也可能陆续发布。

》听到现在考拉读者面临的挑战后,赵梓淳说:“下一个挑战是没有竞争对手。 这条路以前没人走,我不告诉你参考谁,必须一步一步地自己想。

》相关文章:考拉读者已经完成了2000万美元的b轮融资,如何利用AI技术建立中文等级读者系统考拉读者CEO赵梓淳: AI,利用语言学建立国内第一个中文等级读者系统? 前面有“老大哥”,后面有“新势力”。 AI教育江湖谁沉浮? 原创文章,发布许可禁令刊登。 以下,听取刊登的心得。

-黄金城最新娱乐网站。

本文来源:黄金城最新娱乐网站-www.mithrasaree.com