联想 - CCIG 2023

联想

联想集团（下称联想）是一家成立于中国、业务遍及180个市场的全球化科技公司。联想聚焦全球化发展，服务全球超过10亿用户。联想作为全球领先ICT科技企业，为用户与全行业提供整合了应用、服务和最佳体验的智能终端，以及强大的云基础设施与行业智能解决方案。作为全球智能设备的领导厂商，联想每年为全球用户提供数以亿计的智能终端设备，包括电脑、平板、智能手机等。作为企业数字化和智能化解决方案的全球顶级供应商，联想积极推动全行业“设备+云”和“基础设施+云”的发展，以及智能化解决方案的落地。面向新一轮的智能化变革的产业升级契机，联想提出智能变革战略，围绕智能物联网（Smart IoT)，智能基础架构(Smart Infrastructure)，行业智能（Smart Verticals）三个方向成为行业智能化变革的引领者和赋能者。目前，联想全球约有8.2万名员工，业务遍布180多个国家和地区。2021/2022财年，联想集团全年营业额近4600亿人民币。

CCIG网站联想核心技术页面信息

核心技术模块1—人体三维运动感知技术

联想自研构建的面向自然交互的人体三维运动感知技术，实现基于单目RGB摄像头的全身65个关键关节点三维姿态估计、双手各21个关键关节点的三维手部姿态估计，以及基于裸眼3D场景的双眼瞳孔三维坐标估计，支持大范围跟踪及跟踪主体抗多人干扰。

人体三维运动感知技术

解决问题
在低照度的沉浸式全息空间中，实现实时的三维人体运动检测以及跟踪技术，并与增强现实渲染的全息显示技术相互辉映，实现虚实融合的自然交互是待解决的核心问题。

技术应用—全息虚实融合情景化教学课堂：
应用大幅面交互式全息投影技术和高精度定位传感技术，支持多种创新交互教学方式，如AR角色扮演、双面混合现实协作、定格影像教学、实体到虚拟的交互技术等，可以支持教师进行情景化的教学，支持学生进行主动学习和合作学习，激发学生的学习动机，增强学习体验，促进知识迁移。

全息虚实融合沉浸式互动课堂

应用特色：

从“单向”到“多向”，通过多种智能技术和人机交互技术的组合，实现以学生为中心的体验式、探究式、沉浸式的学习方式
从“有书”到“无书”，将教学场景数字化，通过沉浸式多媒体投影系统营造虚拟现实的学习空间

核心技术模块2：文档智能
2.1 教育文档识别技术:
联想提出了面向教育文档的文字识别技术，包括基于多任务的文本检测模型和CNN+增强自注意力机制相结合的字符串识别模型。文本检测模型通过卷积神经网络进行特征提取，然后将特征向量分别送入语义分割分支和目标检测分支，并综合两个分支的结果作为模型输出。字符串识别模型则使用多头自注意力机制提取特征序列关系，有效提升字符识别精度。

教育文档识别技术

解决问题：
在教育场景下，图像来源多样，包括扫描文档、手机拍照和屏幕截图等。这种多样性导致了不同场景下获取的图片有很大的差异。扫描图片通常分辨率高、图片清晰，但拍摄图片通常容易出现运动模糊、纸张扭曲、倾斜和阴影问题。此外，教育场景中存在长短文本较多、文本方向多样的问题，还有一些书本翻页导致的弯曲文本现象。

复杂场景下的文档识别

技术应用：
联想人工智能阅卷系统应用了教育文档识别技术来处理通用纸笔考试的阅卷工作，提供了教师端、管理员端、学生端和扫描客户端的多平台软件方案，从而打造了通用的人工智能阅卷体验，提高了教师针对常态化教学的手工阅卷和学情分析效率以及学生日常考试管理和错题管理效率。

联想人工智能阅卷系统

应用特色：

原始试卷留痕，无需制作题卡，便于日常考试精准化教学。
开放试卷阅卷，不依赖自组卷，使用场景更加灵活自由。
精简教师操作，使阅卷过程更智能、易用性更强。

2.2 板书手写识别技术
联想自研的基于全局和局部特征相结合的模型结构GLRNet，并在此基础上加入语言模型TransLM。该模型提取不同时步上的局部和全局特征关系，有效提高了特征提取效率和计算效率。在ICADAR2013中文联机手写识别比赛测试集上进行测试，结果显示联想方法的编辑距离准确率优于其他方法，速度更快且语言模型的空间占用远远小于其他方法。该方法的特征提取能力、语言模型速度和空间占用显著优于其他现有方法。

板书手写识别技术

解决问题

手写文字具有随意性，没有规范，容易出现笔画变形，连笔、笔画歧义，缺笔等现象，增加了识别难度。
不同书写者书写风格和字体风格也不同。
相似的字或字母也容易混淆，特别是手写体更难识别。

技术应用：
联想提供备授课软硬件一体化解决方案，包括备授课5.0教师备授课一体化软件、教师云空间和联想智慧教育大屏。授课端智能白板可实现自带手写智能识别、汉字卡片及快速检索，连续手写文字，自动AI识别，也可一键转换为汉字卡片，查看每个汉字的偏旁部首、拼音、笔顺等，助力教师上课。

联想备授课软硬件一体化方案

应用特色：

书写流畅、灵活多元的擦除方式，让白板教学更便捷。
AI智能白板-手写文字、函数、图形等智能识别，辅助教学更高效。
虚拟仿真实验，有效突破教学难点，提升学生学习兴趣。
多元课堂活动一键插入，调动学生积极性，提高课堂趣味性。

核心技术模块3：数字人驱动重演技术：
数字人驱动重演技术是一种将现实中的人物数字化，以在虚拟环境中再现他们的外貌、动作和行为的技术。这种技术主要通过高精度的三维扫描和动作捕捉来实现，可以应用于电影、游戏、虚拟现实等领域。联想在虚拟人面部和肢体动作的实时驱动进行了技术攻关，将唇部动作的真实性及肢体动作的多样性和指向性作为研究重点，加强虚拟人的自然度和互动能力。联想提出了基于办公场景下的动作生成模型，结合交互过程中的内容，形成自然流畅的肢体动作，并结合联想在设备端的算力支撑，构建可实时互动的数字员工。

基于普通RGB摄像头的视觉动捕技术

解决问题：
在数字员工工作场景下，数字人需要和外界进行交互，因此根据交互内容驱动数字人动作成为核心需求，

裸眼3D数字前台云/边协同

技术应用：

智能驱动：基于AI推理技术，生成完全源自音频源的面部运动和唇形同步的Blender Shape网格顶点，实现精细到微表情级别的实时面部动画
头部驱动：基于头部姿态生成模型，在演讲过程中，根据演讲内容动态计算对头部姿态的交互需求，生成自然的头部姿态动作
手势驱动：基于预置指定形象的手势动作，在演讲过程中展示丰富的手势动作，根据演讲内容驱动摆手、指引等有特定意义的动作

裸眼3D数字前台

应用特色：

统一服务中心：将集团分布在全国各地的前台人力集中到同一个地方，统一维度，节省人力成本，同时为顾客提供优质的服务。
统一集团形象：集团各分店使用同一个虚拟人形象，为全国各地顾客提供无差别的前台服务。

联想

CCIG网站联想核心技术页面信息

联系我们

会议秘书：周女士

手机：13862081502

中国图象图形学学会
联系人：骆老师、王老师
电话：010-82544676
邮箱: ccig@csig.org.cn