程序员欢乐送(第23期)

2019年5月31日08:59:52 8 356 °C
摘要

程序员欢乐送:speech2face、mathAI、PySOT、TecoGAN、face_recognition、minimalRL、Weights & Biases

程序员欢乐送(第23期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、speech2face

听音识人。只听声音,就能知道一个人长什么样吗?

麻省理工CSAIL(人工智能实验室),最近就发布了这样的研究。只需要听6秒的声音片段,AI就能推断出说话者的容貌。

MIT研究人员,设计和训练的神经网络Speech2Face,就能通过短短的语音片段,推测出说话者的年龄、性别、种族等等多重属性,然后重建说话人的面部。

上图为真实图片,Speech2Face通过语音生成人物头像,下面的图片为算法生成的图像。

程序员欢乐送(第23期)

项目地址:点击查看

2、mathAI

一位叫Roger的中国学生开源了自己的拍照做题程序。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。

整个程序使用python实现,具体处理流程包括了图像预处理、字符识别、数学公式识别、数学公式语义理解、结果输出。

程序员欢乐送(第23期)

项目地址:点击查看

3、PySOT

看过《程序员欢乐送(第20期)》的朋友应该知道这个目标跟踪库PySOT,写第20期的时候,这个算法还没有开源,如今商汤将它开源了。

程序员欢乐送(第23期)

感兴趣的朋友可以看一看。

项目地址:点击查看

4、TecoGAN

TecoGAN是一种针对视频的超分辨率重建算法。图像超分辨率技术指的是根据低分辨率图像生成高分辨率图像的过程,该技术希望根据已有的图像信息重构出缺失的图像细节。视频超分辨率技术则更加复杂,不仅需要生成细节丰富的一帧帧图像,还要保持图像之间的连贯性。

来自慕尼黑工业大学的研究人员提出了一种用于实现视频超分辨率的新型 GAN网络:TecoGAN。

以下三幅动图的右半部分是用 TecoGAN 生成的,说不定用它来重制单机游戏会有更惊人的效果。该方法能够生成精细的细节,较长的生成视频序列也不会影响其时间连贯度。

程序员欢乐送(第23期)

项目地址:点击查看

5、face_recognition

face_recognition是一个老项目了,它是一个强大、简单、易上手的人脸识别开源项目,并且配备了完整的开发文档和应用案例,特别是兼容树莓派系统。

这个项目号称世界上最简洁的人脸识别库,你可以使用Python和命令行工具提取、识别、操作人脸。

人脸识别是基于业内领先的C++开源库 dlib 中的深度学习模型,用Labeled Faces in the Wild人脸数据集进行测试,有高达99.38%的准确率。但对小孩和亚洲人脸的识别准确率尚待提升。

例如,你想要从图片中找到人脸,安装好这个库,只需要写三行代码:

定位图片中的所有人脸结果:

程序员欢乐送(第23期)

此外,还可以识别人脸关键点、识别图片中的人是谁,可以进行人脸实时检测等。

项目地址:点击查看

6、minimalRL

minimalRL是一个强化学习的代码库,该项目使用pytorch框架实现了一些基本的RL算法,每个算法都在一个文件中完成,每个算法的长度都不超过150行,极力做到小巧简洁,即使没有GPU,每个算法也可以在30秒内完成训练。

程序员欢乐送(第23期)

项目地址:点击查看

7、Weights & Biases

机器学习训练模型也好,深度学习训练模型也罢,我们经常需要对训练对一些参数的迭代情况进行可视化,比如使用TensorBoard。

今天推荐另一款可视化工具Weights & Biases,它比TensorBoard更轻量级。每次运行时,可以保存超参数和输出指标,训练过程中能实现可视化模型,还能自动跟踪代码状态,系统指标和配置参数。

程序员欢乐送(第23期)

项目地址:点击查看

快乐

1、篮球场上受过最重的伤害

程序员欢乐送(第23期)

程序员欢乐送(第23期)

程序员欢乐送(第23期)

程序员欢乐送(第23期)

2、减肥

不是我瘦不下来,是没用对方法。

程序员欢乐送(第23期)

财富

之前推送过支付宝的好医保和微信的微医保。

如今,微医保里有多了一个新产品,叫微医保·长期医疗,6年期。

这算是和支付宝的好医保打擂台了,抢占市场。

微医保这个新产品,最大的卖点就是保证6年期限,不用担心6年内产品下架。

合同一签就是6年,合同期间,保险不涨价、合同条款不会变更、产品不下架。

支付宝的长期医疗,是1年期限产品,不过是承诺“保障续保6年”。只能保证可以续保6年,但是这6年内,费率是否会调整,这个在合同里是没有保证的。

而微医保的长期医疗就不同了,直接是6年合同,很实在,更让人放心。

但从价格来看,以21岁为例:

微医保长期医疗有社保为260/年,无社保566/年;好医保长期医疗有社保152/年,无社保412/年。

价格上,微医保确实要贵一些。

对于老百姓而言,最原因看到的就是“神仙掐架”,“打”的越凶,对我们越有好处。

记得几年前刚读本科的时候,饿了吗、美团、百度外卖抢占市场,各种红包送不停,大额减免到手软。后来,微信和支付宝抢占支付市场,也是各种激励政策,随机免单,随机红包,手段层出不穷。

如今,两家神仙又开始在保险领域大展拳脚,是好事!

还是那句话,喜欢哪家买哪家,都挺好。

最后

本周的程序员欢乐送,到此结束,下周再会。

weinxin
微信公众号
分享技术,乐享生活:Jack Cui公众号每周五推送“程序员欢乐送”系列资讯类文章,欢迎您的关注!
Jack Cui

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:8   其中:访客  4   博主  4

    • avatar 志广 来自天朝的朋友 谷歌浏览器 Windows 10 上海市 电信 0

      520暴击伤害

        • avatar Jack Cui Admin 来自天朝的朋友 Safari浏览器 Mac OS X 10_14_4 北京市 百度网讯科技联通节点

          @志广 哈哈~

        • avatar chris_33 来自天朝的朋友 谷歌浏览器 Windows 7 广东省深圳市罗湖区 电信 3

          speech2face的效果看起来很不错啊,渣渣的我还在数据分析与机器学习底层打滚

            • avatar Jack Cui Admin 来自天朝的朋友 Safari浏览器 Mac OS X 10_14_4 北京市 百度网讯科技联通节点

              @chris_33 只能说脑洞很大啊~

            • avatar Pluto4U 来自天朝的朋友 谷歌浏览器 Mac OS X 10_14_3 浙江省杭州市 电信 2

              从MATHAI中看到了以后辅导作业软件的新方向,连Slogan我都替他们想好了:只做数学,我们更专业。

                • avatar Jack Cui Admin 来自天朝的朋友 Safari浏览器 Mac OS X 10_14_4 北京市 百度网讯科技联通节点

                  @Pluto4U 作业帮app貌似就有这种拍题了,印刷体效果不错。不过是简单的算术题。

                • avatar 杰仔很忙 来自天朝的朋友 谷歌浏览器 Windows 10 上海市闵行区 电信 0

                  Hi 我看speech2face非常刚兴趣,但是项目进去是文档及论文,没看到代码,是不是原作者没有开源啊~

                    • avatar Jack Cui Admin 来自天朝的朋友 Safari浏览器 Mac OS X 10_14_4 北京市 百度网讯科技联通节点

                      @杰仔很忙 有论文,但是代码应该是暂未开源,可以给作者发邮件问问。