失眠网 > 本周AI热点回顾：Apollo自动驾驶商用上岗；19款国产手机无一幸免：15分钟破解人脸识别...

本周AI热点回顾：Apollo自动驾驶商用上岗；19款国产手机无一幸免：15分钟破解人脸识别...

时间：2018-11-14 17:52:23

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们

「百度@了所有车企」：Apollo自动驾驶商用上岗，欢迎上车

1月25日，由威马汽车主办的“WeLab威马科技开放日”在上海举行，搭载百度Apollo AVP自主泊车方案的威马W6亮相。

场景明确，功能刚需。

车主平常最头疼的停车、找车位，以及停车入位，从威马W6开始，这些事都不会成为麻烦——一切交给了AI司机。

国内品牌实现量产级L4，威马W6是首例。

而这不光是这个品牌本身抢占先机，更是它身后的技术、新商业模式的第一次示范性证明。

广汽、长城……等等传统OEM的类似产品能力上岗，只会是时间问题。

因为，在它们背后同时提供技术支持的，都是百度Apollo自动驾驶。

信息来源：量子位

堪比当年的LSTM，Transformer引燃机器学习圈：它是万能的

谷歌研究科学家 David Ha：Transformer 是新的 LSTM。

年 6 月谷歌发布论文《Attention is All You Need》时，我们或许都没有意识到它提出的 Transformer 架构将带来多少惊喜。

在诞生至今不足四年的时间里，Transformer 不仅成为自然语言处理领域的主流模型（基于 Transformer 的预训练语言模型成为主流），还开始了向其他领域的跨界，近几个月来出现了大量将 Transformer 应用于计算机视觉领域的研究。

年 10 月，谷歌提出了Vision Transformer (ViT)，可以直接利用 transformer 对图像进行分类，而不需要卷积网络。ViT 模型取得了与当前最优卷积网络相媲美的结果，但其训练所需的计算资源大大减少。

年 12 月，复旦、牛津、腾讯等机构的研究者提出了 SEgmentation TRansformer（SETR），将语义分割视为序列到序列的预测任务，该模型在 ADE20K 上排名第一，性能优于 OCNet、GCNet 等网络。

年 1 月初，OpenAI 又连放大招，用 DALL·E 和 CLIP 打破了自然语言与视觉的次元壁。两个模型都利用 Transformer 达到了很好的效果，前者可以基于本文直接生成图像，后者则能完成图像与文本类别的匹配。

由此，「Transformer 是万能的吗？」成为了近期机器学习社区的热门话题。谷歌大脑研究员 David Ha 发推表示：Transformer 是新的 LSTM。

他否定了自己在年 5 月发表的言论：「LSTM 就像神经网络中的 AK47。不管我们多么努力地想用新事物取代它，都是白费力气。从现在起它还将应用 50 年。」LSTM 由 Sepp Hochreiter 和 Jürgen Schmidhuber 于 1997 年联合提出，当时已诞生 20 年。

David Ha 不会想到，这句预言被一个月后出现的 Transformer 打破，而这仅用了 4 年时间。

信息来源：机器之心

Github Star 突破10K！超级好用的OCR数据合成与半自动标注工具，强烈推荐！

OCR方向的工程师，一定需要知道这个OCR开源项目：PaddleOCR。

短短几个月，累计Star数量已超过10K！！！频频登上Github Trending 日榜月榜，称它为OCR方向目前最火的repo绝对不为过。

最近，它又带来四大新发布与升级：

核心内容先睹为快：

全新发布数据合成工具Style-Text：可以批量合成大量与目标场景类似的图像，在多个场景验证，效果均提升15%以上。

全新发布半自动数据标注工具PPOCRLabel：有了它数据标注工作事半功倍，相比labelimg标注效率提升60%以上，社区小规模测试，好评如潮。

多语言识别模型效果升级：在开源测试集评估，中文、英文、韩语、法语、德语、日文识别效果均优于EasyOCR。

PP-OCR开发体验再升级：支持动态图开发（训练调试更方便），静态图部署（预测效率更高），鱼与熊掌可以兼得。

PaddleOCR历史表现回顾

先看下PaddleOCR自去年6月开源以来，短短几个月在GitHub上的表现：

6月，8.6M超轻量模型发布，GitHub Trending 全球趋势榜日榜第一。

8月，开源CVPR顶会SOTA算法，再上GitHub趋势榜单！

10月，发布PP-OCR算法，开源3.5M超轻量模型，再下Paperswithcode 趋势榜第一

这个含金量，广大的GitHub开发者们自然懂。

3.5M超超轻量模型的效果图大家直接看，绝对杠杠的。

火车票、表格、金属铭牌、翻转图片、外语都是妥妥的。

3.5M的模型能达到这个识别精度，绝对是良心之作了！

传送门：

/PaddlePaddle/PaddleOCR

信息来源：飞桨PaddlePaddle

19款国产手机无一幸免：15分钟破解人脸识别，打印眼镜让刷脸形同虚设

你的新手机不错，借我刷一下脸？

人脸识别技术在智能手机上已经是标配，今天的我们刷脸解锁、刷脸支付就像吃饭喝水一样自然，以至于疫情期间戴口罩无法解锁手机时，我们会感到很不习惯。

在享受便利的同时，却鲜有用户去关心安全问题。虽然手机厂商往往会在发布手机的时候宣称「破解人脸识别的几率低至百万分之一」，但双胞胎解锁对方手机的事情仍然偶尔会上新闻。

最近一段时间，来自清华的 RealAI（瑞莱智慧）向我们展示了一项更为简单的攻击技术……在一副眼镜的攻击下，19 款使用 2D 人脸识别的国产安卓手机无一幸免，全部被快速破解。

具体来说，RealAI 团队选取了 20 款手机做了攻击测试，覆盖不同价位的低端机与旗舰机。

测试者佩戴了一副含有对抗样本图案的眼镜，制作这副眼镜的成本很低：借用一台打印机，加上一张 A4 纸。

对抗眼镜。

最终，除了一台 iPhone11，其余安卓机型全部解锁成功，完成整个破解过程只花了 15 分钟。攻击测试人员成功解锁手机后，任意翻阅机主的微信、信息、照片等个人隐私信息，甚至还可以通过手机银行等个人应用 APP 的线上身份认证完成开户。

RealAI 团队表示，这一攻击测试主要利用了人工智能算法存在的「对抗样本」漏洞，但不同于之前的攻击尝试主要在实验环境下进行，而这次手机的攻击测试则佐证了这一安全漏洞的真实存在性。

RealAI 表示，这是世界唯一通过 AI 对抗样本技术攻破商用手机人脸解锁的案例。

更为严重的问题在于，这一漏洞涉及所有搭载人脸识别功能的应用和设备，一旦被黑客利用，隐私安全与财产安全都将受到威胁。

信息来源：机器之心

05‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

再夺AI专业全球冠军！清华力压CMU夺得CSRankings高校AI领域第一‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

每次CSRankings更新，都会引发舆论大哗。

今年这个让大家关注的排名终于又更新了！全球院校计算机科学领域实力排名开源项目CSRankings，更新了-的最新数据。

进入前20名的中国机构还有：中国科学院、上交大、港中文、浙大和南大。

CSRankings（Computer Science Rankings）：是由马萨诸塞大学安姆斯特分校（University of Massachusetts Amherst）信息与计算机科学学院教授Emery Berger发布的基于研究指标（全球各机构的学者在各顶级学术会议上发表的论文）的全球顶尖计算机科学机构排名。

虽然有人觉得CSRankings比较「雷人」，但它以计算机领域各大顶会的论文数量为衡量指标，相对来说比较透明和更有意义。

信息来源：新智元

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础，是中国首个开源开放、技术领先、功能完备的产业级深度学习平台，包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件，持续开源核心能力，为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台，针对企业级需求增强了相应特性，包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业，提供零门槛、预置丰富网络和模型、便捷高效的开发平台；BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

END

如果觉得《本周AI热点回顾：Apollo自动驾驶商用上岗；19款国产手机无一幸免：15分钟破解人脸识别...》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。