一文看尽2018全年计算机视觉大突破_技术专利_米乐体育app客户端下载

新闻动态

技术专利企业动态行业资讯

一文看尽2018全年计算机视觉大突破

来源：米乐体育app官方下载ios版发布时间：2024-02-03 23:52:10

计算机视觉领域同样精彩纷呈，与四年前相比GAN生成的假脸逼真到让人不敢相信；新工具、新框架的出现，也让这样的领域的明天特别让人期待……

近日，Analytics Vidhya发布了一份2018人工智能技术总结与2019趋势预测报告，原文作者PRANAV DAR。这份报告总结和梳理了全年主要AI技术领域的重大进展，同时也给出了相关的资源地址，以便大家更好的使用、查询。

今年，无论是图像还是视频方向都有大量新研究问世，有三大研究曾在CV圈掀起了集体波澜。

今年9月，当搭载BigGAN的双盲评审中的ICLR 2019论文现身，行家们就沸腾了：简直看不出这是GAN自己生成的。

在计算机图像研究史上，BigGAN的效果比前人进步了一大截。比如在ImageNet上进行128×128分辨率的训练后，它的Inception Score（IS）得分166.3，是之前最佳得分52.52分3倍。

除了搞定128×128小图之外，BigGAN还能直接在256×256、512×512的ImageNet数据上训练，生成更让人信服的样本。

在论文中研究人员揭秘，BigGAN的惊人效果背后，真的付出了金钱的代价，最多要用512个TPU训练，费用可达11万美元，合人民币76万元。

不止是模型参数多，训练规模也是有GAN以来最大的。它的参数是前人的2-4倍，批次大小是前人的8倍。

在完整的ImageNet上训练一个模型需要多久？各大公司不断下血本刷新着记录。

今年8月，在线深度学习课程Fast.ai的创始人Jeremy Howard和自己的学生，用租来的亚马逊AWS的云计算资源，18分钟在ImageNet上将图像分类模型训练到了93%的准确率。

这样拔群的成绩，成本价只需要40美元，Fast.ai在博客中将其称作人人可实现。

只要一幅动态的语义地图，就可获得和真实世界几乎一模一样的视频。换句话说，只要把你心中的场景勾勒出来，无需实拍，电影级的视频就可以自动P出来：

这背后的vid2vid技术，是一种在生成对抗性学习框架下的新方法：精心设计的生成器和鉴别器架构，再加上时空对抗目标。

这种办法能够在分割蒙版、素描草图、人体姿势等多种输入格式上，实现高分辨率、逼真、时间相干的视频效果。

Analytics Vidhya预计，明年在计算机视觉领域，对现有方法的改进和增强的研究可能多于创造新方法。

在美国，政府对无人机的限令可能会稍微“松绑”，开放程度可能增加。而今年大火的自监督学习明年可能会应用到更多研究中。

Analytics Vidhya对视觉领域也有一些期待，目前来看，在CVPR和ICML等国际顶会上公布最新研究成果，在工业界的应用情况还不乐观。他希望在2019年，能看到更多的研究在实际场景中落地。

没有异议的是，不管争辩的结果是什么，我们都要掌握和了解最新的工具，否则就非常有可能被行业所抛弃。

今年，机器学习领域的工具和框架仍在快速的发展，下面就是这方面的总结和展望。

根据10月GitHub发布的2018年度报告，PyTorch在增长最快的开源项目排行上，名列第二。也是唯一入围的深度学习框架。

相较而言，PyTorch速度快而且非常灵活，在GitHub上有更多的开码都采用了PyTorch框架。能预见，明年PyTorch会更加普及。

至于PyTorch和TensorFlow如何抉择？在我们之前发过的一篇报道里，不少大佬站PyTorch。

实际上，两个框架越来越像。前Google Brain深度学习研究员，Denny Britz认为，大多数情况下，选择哪一个深度学习框架，其实影响没那么大。

很多人将AutoML称为深度学习的新方式，认为它改变了总系统。有了AutoML，我们就不再要设计复杂的深度学习网络。

今年1月17日，谷歌推出Cloud AutoML服务，把自家的AutoML技术通过云平台对外发布，即便你不懂机器学习，也能训练出一个定制化的机器学习模型。

不过AutoML并不是谷歌的专利。过去几年，很多公司都在涉足这样的领域，比方国外有RapidMiner、KNIME、DataRobot和H2O.ai等等。

这是一个用于执行AutoML任务的开源库，意在让更多人即便没有人工智能的专家背景，也能搞定机器学习这件事。

这是一个面向Java开发者的机器学习框架，可以完全在浏览器中定义和训练模型，也能导入离线训练的TensorFlow和Keras模型进行预测，还对WebGL实现无缝支持。

在浏览器中使用TensorFlow.js可以扩展更多的应用场景，包括展开交互式的机器学习、所有数据都保存在客户端的情况等。

谷歌还给了几个TensorFlow.js的应用案例。比如借用你的摄像头，来玩经典游戏：吃豆人（Pac-Man）。

在工具这个主题中，最受关注的就是AutoML。因为这是一个真正会改变游戏规则的核心技术。在此，引用H2O.ai的大神Marios Michailidis（KazAnova）对明年AutoML领域的展望。

干货下载：必须备注“机器视觉：学校/公司+研究方向”，否则就没办法通过验证），合作交流或获取机器视觉教程，行业报告等资源，持续更新中。。。返回搜狐，查看更加多