对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。
技术
1、speech2face
听音识人。只听声音,就能知道一个人长什么样吗?
麻省理工CSAIL(人工智能实验室),最近就发布了这样的研究。只需要听6秒的声音片段,AI就能推断出说话者的容貌。
MIT研究人员,设计和训练的神经网络Speech2Face,就能通过短短的语音片段,推测出说话者的年龄、性别、种族等等多重属性,然后重建说话人的面部。
上图为真实图片,Speech2Face通过语音生成人物头像,下面的图片为算法生成的图像。
项目地址:点击查看
2、mathAI
一位叫Roger的中国学生开源了自己的拍照做题程序。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。
整个程序使用python实现,具体处理流程包括了图像预处理、字符识别、数学公式识别、数学公式语义理解、结果输出。
项目地址:点击查看
3、PySOT
看过《程序员欢乐送(第20期)》的朋友应该知道这个目标跟踪库PySOT,写第20期的时候,这个算法还没有开源,如今商汤将它开源了。
感兴趣的朋友可以看一看。
项目地址:点击查看
4、TecoGAN
TecoGAN是一种针对视频的超分辨率重建算法。图像超分辨率技术指的是根据低分辨率图像生成高分辨率图像的过程,该技术希望根据已有的图像信息重构出缺失的图像细节。视频超分辨率技术则更加复杂,不仅需要生成细节丰富的一帧帧图像,还要保持图像之间的连贯性。
来自慕尼黑工业大学的研究人员提出了一种用于实现视频超分辨率的新型 GAN网络:TecoGAN。
以下三幅动图的右半部分是用 TecoGAN 生成的,说不定用它来重制单机游戏会有更惊人的效果。该方法能够生成精细的细节,较长的生成视频序列也不会影响其时间连贯度。
项目地址:点击查看
5、face_recognition
face_recognition是一个老项目了,它是一个强大、简单、易上手的人脸识别开源项目,并且配备了完整的开发文档和应用案例,特别是兼容树莓派系统。
这个项目号称世界上最简洁的人脸识别库,你可以使用Python和命令行工具提取、识别、操作人脸。
人脸识别是基于业内领先的C++开源库 dlib 中的深度学习模型,用Labeled Faces in the Wild人脸数据集进行测试,有高达99.38%的准确率。但对小孩和亚洲人脸的识别准确率尚待提升。
例如,你想要从图片中找到人脸,安装好这个库,只需要写三行代码:
1 2 3 | import face_recognition image = face_recognition.load_image_file("your_file.jpg") face_locations = face_recognition.face_locations(image) |
定位图片中的所有人脸结果:
此外,还可以识别人脸关键点、识别图片中的人是谁,可以进行人脸实时检测等。
项目地址:点击查看
6、minimalRL
minimalRL是一个强化学习的代码库,该项目使用pytorch框架实现了一些基本的RL算法,每个算法都在一个文件中完成,每个算法的长度都不超过150行,极力做到小巧简洁,即使没有GPU,每个算法也可以在30秒内完成训练。
项目地址:点击查看
7、Weights & Biases
机器学习训练模型也好,深度学习训练模型也罢,我们经常需要对训练对一些参数的迭代情况进行可视化,比如使用TensorBoard。
今天推荐另一款可视化工具Weights & Biases,它比TensorBoard更轻量级。每次运行时,可以保存超参数和输出指标,训练过程中能实现可视化模型,还能自动跟踪代码状态,系统指标和配置参数。
项目地址:点击查看
快乐
1、篮球场上受过最重的伤害
2、减肥
不是我瘦不下来,是没用对方法。
财富
之前推送过支付宝的好医保和微信的微医保。
如今,微医保里有多了一个新产品,叫微医保·长期医疗,6年期。
这算是和支付宝的好医保打擂台了,抢占市场。
微医保这个新产品,最大的卖点就是保证6年期限,不用担心6年内产品下架。
合同一签就是6年,合同期间,保险不涨价、合同条款不会变更、产品不下架。
支付宝的长期医疗,是1年期限产品,不过是承诺“保障续保6年”。只能保证可以续保6年,但是这6年内,费率是否会调整,这个在合同里是没有保证的。
而微医保的长期医疗就不同了,直接是6年合同,很实在,更让人放心。
但从价格来看,以21岁为例:
微医保长期医疗有社保为260/年,无社保566/年;好医保长期医疗有社保152/年,无社保412/年。
价格上,微医保确实要贵一些。
对于老百姓而言,最原因看到的就是“神仙掐架”,“打”的越凶,对我们越有好处。
记得几年前刚读本科的时候,饿了吗、美团、百度外卖抢占市场,各种红包送不停,大额减免到手软。后来,微信和支付宝抢占支付市场,也是各种激励政策,随机免单,随机红包,手段层出不穷。
如今,两家神仙又开始在保险领域大展拳脚,是好事!
还是那句话,喜欢哪家买哪家,都挺好。
最后
本周的程序员欢乐送,到此结束,下周再会。
2019年5月31日 上午9:39 沙发
520暴击伤害
2019年5月31日 上午10:07 1层
@志广 哈哈~
2019年5月31日 上午9:50 板凳
speech2face的效果看起来很不错啊,渣渣的我还在数据分析与机器学习底层打滚
2019年5月31日 上午10:07 1层
@chris_33 只能说脑洞很大啊~
2019年5月31日 上午10:05 地板
从MATHAI中看到了以后辅导作业软件的新方向,连Slogan我都替他们想好了:只做数学,我们更专业。
2019年5月31日 上午10:08 1层
@Pluto4U 作业帮app貌似就有这种拍题了,印刷体效果不错。不过是简单的算术题。
2019年5月31日 下午7:11 4楼
Hi 我看speech2face非常刚兴趣,但是项目进去是文档及论文,没看到代码,是不是原作者没有开源啊~
2019年6月3日 上午9:44 1层
@杰仔很忙 有论文,但是代码应该是暂未开源,可以给作者发邮件问问。