小米集团2019年第二季度财报显示,截止至2019年6月30日,共投资超过270家公司,截至当时的公告日期,小米已投资12家供应链公司,其中有三家已经在中国科创板上市。
主题日从技术与商业创新的路径出发,共展开了5G 生态的投资策略埃森哲洞察:中国独角兽进化论大众汽车‘原型座舱发布仪式医药发展从‘模仿创新到‘原始创新的必经之等10场主题演讲,以及包括进化中的大企业创新4.0重新定义物流运输ESG 影响力投资助力实现碳中和目标等在内的5场圆桌活动,共同探讨大企业未来生态构建的方式,寻找产业创新的动力。本届峰会是创业邦自2007年以来举办的第十四届活动,一路走来,创业邦始终努力为大企业和高成长企业创新发展搭建高规格交流平台,坚持为广大创业者服务,目前已经沉淀为国内最具影响力的创新峰会之一。
第二,游戏始终是出海的热点。本次峰会为期两天,共有150余位著名学者、跨国企业与创新成长企业高层、知名投资机构参与演讲和圆桌论坛,全国各地逾5000人次专业观众前来参会,逾500万观众通过直播平台在线观看活动实况,共同探讨创新动能激发之路,推动大企业与创新成长企业共建生态,塑造未来产业新形态。从细分赛道来看,芯片设计领域、相关材料及设备等都是非常好的赛道。英特尔资本董事总经理、中国区总经理王天琳,浦发硅谷银行副行长、企业银行部总经理敖宇翔,SPC芯动能合伙人周立,光速中国助理合伙人朱嘉等人分享了对半导体行业的看法。他们认为,出海是中国产业全球化的必然选择,在互联网这个行业里,出海主要有三个方向:第一,泛工具类产品的出海。
2021 DEMO WORLD 世界创新峰会——大企业创新与创投生态峰会现场(5月28日)大企业与创新生态双向赋能:哪些赛道最值得关注?在《大企业的创新之路与CVC的发展史》的主题演讲上,清华大学经济管理学院创新创业与战略系教授马旭飞表示,现在CVC关注的主要市场是日本和中国。2018年以来,创业邦成立了专门的团队,持续跟进大企业的创新趋势,深入实地调研创新的技术、投资与合作模式。AISHELL-2由1991名来自中国不同口音区域的发言人参与录制,文本内容主要涉及唤醒词、语音控制词、智能家居、无人驾驶、工业生产等12个领域。
响应国家号召,加深【开源】项目建设今年3月12日,新华社播发《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》,其中【开源】首次被明确列入国民经济和社会发展五年规划纲要。数据库的建设及服务还保持着一定的壁垒,通用场景的AI技术不断成熟,如何建设高精尖数据库在行业当下也需要去解决。行业繁荣的景象之下,还存在着一些问题,由于AI基础数据服务的数据标注业务相对门槛较低,玩家鱼龙混杂,使行业标准模糊,服务质量参差不齐。AISHELL-2是全球最大的中文语音数据开源项目,也是最成功的。
此外,希尔贝壳持续在数据开源的项目上做投入,目前开源的数据库申请规模已经达到了500+,实现了我们开源数据助力产学研共同发展的目的,在希尔贝壳的品牌建设上也树立了口碑,在业务上也给希尔贝壳开拓了新的方向。AISHELL-2的开源项目,确定了数据开源的模式,即算法方案、优质的数据集、实验系统的描述这三个维度来做方案,让开源项目能够惠及更多的开发者。
并经过专业语音校对人员转写标注,通过了严格质量检验,数据库文本正确率在98%以上。这个开源项目不只局限于数据,还包括Kaldi配套的recipe应用。在AI新基建的路上,非结构化数据的管理、标注、分析、安全等还有很多问题需要解决,基础数据服务要跟上产业的发展投入研发拓展创新,才能真正做到服务产业服务好产业。同时成立了AISHELL Foundation来共同推进语音数据和技术的不断开源计划。
在人工智能快速迭代更新的节点,卜辉发现AI技术成本的变化速度惊人且市场竞争激烈,比如一套通用AI系统相比一年前,价格基本折了三分之一,但是成就技术的数据并没有贬值。卜辉一直强调,创新的力量,尽管数据服务属于人工智能产业的基础层,越基础越要做到扎实,思考不能局限在这一层,从产业的角度去思考和改变,不断提升我们的业务能力。因为数据库是为算法和应用层服务的,在对算法有一定的了解背景下去做数据库,则更为清晰。从纲要提到的支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务,可以看出国家在战略层面对「开源」的肯定和支持。
同时搭载全球最大开源语音识别系统Kaldi做了一套开源方案,将有研发价值的数据贡献到科研教育机构。谈及未来的规划,卜辉说道:通过技术引领数据业务的发展,通过数据带动技术产业的成熟,在未来用前沿的数据库去服务开发者和科研人员,降低企业在算法落地层面的成本。
希尔贝壳成立于2017年,深耕场景AI数据服务,做好数据服务的技术创新同时并开始思考数据产业的下一步方向。在数据任务分发、自动纠错、数据质量跟踪上,提高了数据标注的效率,降低了1/3的人工成本,实现从人工到技术,再让技术辅助人工完成高效的标注工作。
另外,技术落地数据先行是一个必然的趋势。探索及制作高精尖数据库自建数据库,是希尔贝壳创立之初就带有的基因,经过4年的探索之后,卜辉越发地重视数据库的业务,高精尖数据库的研发投入也不断扩大。在卜辉看来,好的数据能够帮助算法更好的去落地。场景数据开源的方案希尔贝壳也陆续公开发布了 HI-MIA,智能家居场景的语音唤醒开源项目;联合昆山杜克大学一起发布的多说话人语音合成项目AISHELL-3。但卜辉对数据的思考并不止于此,让懂技术的人去做数据,可以看到数据完整的生命周期。对此,希尔贝壳2018年研发并应用了四套智能标注系统来降低数据处理的成本:语音数据质量评测系统、语音自动标注系统、音频检索系统、智能化标注众包大数据分析系统。
更是把智能语音技术+数据开源的方案树立起了希尔贝壳自有的能力门槛,前沿技术落地数据先行的理念在希尔贝壳充分得到验证。尽管身处在AI基础数据服务行业,但从希尔贝壳的4年发展路径来看,聚焦场景化数据业务,其对人工智能数据的思考和创新不止于此,这和创始人卜辉的创新思维有很大的联系。
在这样的背景下,智能化辅助标注平台显得尤为重要。人工智能时代已然来临,伴随着人工智能在各个场景中的落地应用,算法、算力不再是高壁垒,为了不断提高算法精度,算法所必须的数据需求也空前爆发,一度催生了AI基础数据服务行业的繁荣。
在AI基础数据服务行业中,希尔贝壳已经拥有了成熟的两大业务形式,包括数据集产品(自建并开源数据库)和数据需求的定制服务(数据采集/标注)。AISHELL-1开源之后,卜辉发现,高校学生在使用这套方案的同时,很多中小型企业也在利用它进行语音识别技术的研发和产品相关研究,但效果就偏弱了一些。
对比CV领域ImageNet这样的开源数据库,我们做的还远远不够,但我们会持续做下去,也希望整个产业有更多的人来贡献。这和卜辉最开始切入行业的初衷不谋而合。在卜辉看来,希尔贝壳用4年的时间做数据层面的创新只是第一步。希尔贝壳目前已形成了智能语音技术+数据的矩阵开源方案,覆盖语音识别、声纹识别、语音合成、场景智能语音技术应用方案。
而卜辉提到的开源数据项目,就是【AISHELL系列的精标语音数据集】网版权文章,未经授权禁止转载
网原创文章,未经授权禁止转载网原创文章,未经授权禁止转载
未来,阿里云基础设施也将通过持续举办竞赛等多种形式构建智能运维产学研链条、桥梁和纽带,探索新基建下的技术创新。阿里云基础设施负责人周明在现场致辞中表示,此次比赛搭建了一个链接阿里云基础设施与行业、高校之间的产学研合作平台,一方面通过产业实践推动学界理论发展,另一方面通过学界理论研究和实践研究来反哺产业界。
第二届阿里云智能运维算法大赛圆满落幕,但对生产系统中的内存故障预测,尤其是内存故障引发的非预期宕机问题等的讨论和研究还远远没有停止,相信通过天池这样的开发者众智平台,能帮助学生更好地链接理论与实践,在学校就能了解真实的业务场景是什么,实践中的痛点和难点。未来,也期待有更多的同学,甚至更多的科技发烧友参与进来,大家一起贡献智慧和力量,在这个平台共同探讨企业发展过程中最有挑战的问题。近十年来,工业和学术界都开展过关于内存故障预测的相关研究探索,然而对工业级大规模生产环境下的内存故障预测的研究却很少。相比第一届大赛,参赛队伍增加,比赛也异常激烈。
智能运维正处于蓬勃发展阶段,需要社会各界的广泛参与和合作,这次比赛起到了很好的纽带作用,不仅贡献了前所未有的超大规模真实数据,而且产出了多个行之有效的领先方案,希望这个平台能够持续办下去,推动智能运维产业更好发展。本次大赛基于阿里云天池平台举办,聚焦于解决大规模生产系统中的内存故障预测,尤其是内存故障引发的非预期宕机问题,得到了众多高校学子的关注,吸引了超过1300支队伍参赛。
同时,此次比赛也输出了数十份来自国内外高校团队贡献的高质量解决方案,发表数十篇优秀论文,为数据中心内存类故障预测相关问题提供了他们的宝贵解决思路。未来,阿里云基础设施将持续进行技术探索,推动技术与实践结合,通过类似平台,建立与高校、学生之间的产学研链接,一起共创企业数字化转型之路。
在此背景下,为了更好地利用数字化方式提升服务体验,并与更多的优秀技术人员共同探讨此类问题的解决思路与方案,第二届阿里云智能运维算法大赛应运而生。2020年以来,全球经历了新冠疫情的严峻考验,各行各业对5G、大数据、人工智能等新一轮技术发展提出了更高、更新的要求,这一切都离不开作为技术底座的云计算基础设施的稳定与创新,而基础设施的智能运维发挥着保驾护航的重要作用,在持续提升稳定性,减排增效,加速产业升级等方面提供了不可或缺的关键驱动力。
网友点评
已有0条点评 我要点评