产业

从Ignite 2021解读微软:让元宇宙和人工智能创造更多可能

岁末年初,大家都习惯做一些总结和预测,总结一下 2021 年的关键词,预测一下 2022 年科技行业将会有哪些热点。无论如何总结和预测,“元宇宙”都毫无争议的是一大热点。

岁末年初,大家都习惯做一些总结和预测,总结一下 2021 年的关键词,预测一下 2022 年科技行业将会有哪些热点。无论如何总结和预测,“元宇宙”都毫无争议的是一大热点。

元宇宙是利用科技手段进行链接与创造的,与现实世界映射和交互的虚拟世界,具备新型社会体系的数字生活空间。疫情加速了新技术的发展,加速了非接触式文化的形成,人类社会到达了虚拟化的临界点,元宇宙打开了一个通往众多可能性的大门。

拥有多重优势的数字科技巨头们纷纷布局,甚至加码元宇宙赛道。Facebook 直接改名“Meta”,以示对元宇宙势在必得的决心,谷歌、苹果也都纷纷宣布将在明年投巨资在元宇宙上。在前不久举办的微软 Ignite 大会上,微软也宣布了自己的元宇宙项目,正式宣布进军元宇宙。

从 to B 的视角审视元宇宙

在微软看来,元宇宙并不是某一项技术或者平台,而更像是互联网的 3D 版,一个将大家连结起来的环境。

无论是 Facebook 还是 Roblox,都是一种典型的 to C 场景,是在社交和游戏中对沉浸感强相关或强需求的场景。而微软则从 to B 的角度出发,来审视元宇宙。

早在几年前,微软就利用混合现实智能眼镜设备 HoloLens,将沙盒游戏《我的世界》从屏幕上投射到现实中,很多身临其境的游戏体验和元宇宙的设定已经非常类似。HoloLens 如今已经迭代至第二代。在过去的几年中,微软与成千上万的企业客户合作,利用 HoloLens 挖掘了六大具有快速价值实现和高可靠投资回报率的场景,包括:训练和模拟、培训及任务指引、远程协助、设计及原型制作、销售协助、场景数据叠加。

除了 HoloLens 的硬件,微软的元宇宙布局还有 SaaS 软件层面的支撑。在今年的 Ignite 技术大会上,微软围绕元宇宙发布了两项重要功能:

首先是 Mesh for Microsoft Teams 结合了 Microsoft Mesh 的混合现实功能。Microsoft Mesh 是一个由 Azure 支持的全新混合现实平台,同时允许支持跨地理团队进行协作式会议、设计会话、协助同事、共同学习和社交对话等等。用户一开始会通过卡通式化身来具现自己,但随着时间的推移,可以利用全息瞬移来投射出最逼真的自我。Mesh for Microsoft Teams 则允许不同位置的人们通过生产力工具 Teams 加入协作,召开会议、发送信息、处理共享文档等,共享全息体验。该解决方案计划于 2022 年开始推出。

第二是 Dynamics 365 Remote assist& Guides,它提供了一个全新视角,帮助管理者深入了解客户在零售商店、员工在工厂车间等空间内的移动和互动方式,以及如何在混合工作环境中优化健康及安全管理。

值得注意的是,无论是中间层的 Dynamic 365、Microsoft Mesh,还是上层的 HoloLens2、VR 等智能终端设备,都是由底层的 Azure 来提供平台级支持,根据客户的需要来进行定制化的开发,进而满足客户的个性化的场景需求。目前,Azure 上已经有一些 PaaS 服务来支持混合现实 / 元宇宙的开发,包括:Spatial anchors, remote rendering 和 Digital twins。

强大的语言认知服务,实现 103 种语言的翻译

相较于元宇宙这个新鲜事务,人工智能就是“老生常谈”了。微软在过去的 20 年中,在人工智能领域持续投入,积累了大量的专利和技术成果,并将这些成果融入到产品和服务中。

事实上,微软更喜欢用“大规模的计算 + 机器学习”来表示“人工智能”。微软在做的就是让大规模集中运算和机器学习的能力,能够为实际业务需求服务。

认知服务是微软人工智能服务数量相对最多的一个板块,包括视觉、语音、语言、知识、搜索等几个方面。生活中各式各样的翻译器、语音助手等等,都是认知服务的应用场景。在微软认知服务的帮助下,开发者可以让自己的应用识别手势、翻译多种语言,通过解析视频实现快速搜索、编辑、实时添加字幕,甚至可以通过定制数据来识别某种特定类别的画面。

微软的机器翻译技术是一种称为 Z-code 的多语言 AI 模型。该模型结合了来自一个语系的多种语言,例如印地语、马拉地语和古吉拉特语的印度语言。通过这种方式,各个语言模型相互学习,从而降低了实现高质量翻译所需的数据需求。例如,当翻译模型与相关的法语、葡萄牙语、西班牙语和意大利语数据一起训练时,罗马尼亚语的翻译质量得到了提高。

据了解,微软 Azure 认知服务翻译的语言总数已达 103 种,包含了对粤语等方言的支持,更贴近中国本土的需求。微软 Azure 的翻译服务已经可以在全球 56.6 亿人所使用的不同母语之间实现文本文档的互译。

Azure OpenAI Service 开启有限预览

在机器学习领域,OpenAI 的 GPT-3 在网络媒体上引起热议。这是一种具有 1,750 亿个参数的自然语言深度学习模型,比以前的版本 GPT-2 高 100 倍。该模型经过了将近 0.5 万亿个单词的预训练,并且在不进行微调的情况下,可以在多个 NLP 基准上达到最先进的性能。GPT-3 作为一个无监督模型,几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上表现卓越,例如在法语 - 英语和德语 - 英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器,在两位数的加减运算任务上达到几乎 100% 的正确率,甚至还可以依据任务描述自动生成代码。

在微软 Ignite 大会上,微软宣布将通过新的 Azure OpenAI 服务帮助客户发现这些体验,该服务允许通过 Azure 平台访问 OpenAI 的 API,并且最初只能通过邀请获得。新的 Azure 认知服务将使客户能够访问 OpenAI 强大的 GPT-3 模型,以及 Microsoft Azure 中内置的安全性、可靠性、合规性、数据隐私和其他企业级功能。

微软还将为 Azure OpenAI 服务客户提供新工具,以帮助确保模型返回的输出适合他们的业务,并将监控人们如何使用该技术以帮助确保其用于预期目的。

微软认为,未来 AI 到底能不能够被更好地、更深入地被应用,取决于 AI 是否够被更完整的封装和更简单的调用。因为,大多数的公司没有足够的技术人员支撑,可以从 0 开始做算法等研究工作。只有把 AI 封装地更完整,变成一个开箱即用的产品,才能被应用到更多的场景中,被更好地普及和推广。

除了元宇宙和 AI,作为全球顶级技术盛会,Microsoft Ignite 释放了更多精彩技术内容。在 2022 年 1 月 6 日 -7 日的 Microsoft Ignite China(微软在线技术大会中国站)上,诸多技术专家将与技术爱好者们一起探讨了更多前沿科技趋势,精彩不容错过!

24快报
JSON抓取失败