一直保持的追求有三点:技术、快乐、财富,这里记录每周值得分享的内容,周五把欢乐送达。
技术
1、RMFD
RMFD 是由武汉大学国家多媒体软件工程技术研究中心发布的开源口罩遮挡人脸数据集。
全球新型冠状病毒肆虐,我国几乎人人戴口罩,具有海量样本基数。
作者收集样本,建立全球最大口罩人脸数据集,并向社会开放,为当前及今后可能的类似公共安全事件智能管控积累数据资源。
同时,作者也基于口罩人脸数据,设计了相应口罩遮挡人脸检测和识别算法,帮助社区封闭时的人员进出管控,车站、机场的人脸识别闸机以及人脸门禁考勤设备的升级,适应行人口罩蒙面遮挡的应用环境。
有这方面数据需求的朋友,可以自取。
项目地址:点击查看
2、AnimeGAN
AnimeGAN 这个基于 GAN 的二次元妹子头像生成算法,应该都不陌生,该算法诞生于 2017 年,属于老牌经典的 GAN 网络。
最近,发现了一个基于 AnimeGAN 的不错的玩法:照片动漫风。
左侧是真实照片,右侧是漫画风的效果。
这种算法的应用应该已经有一些了,类似于一种动漫画的滤镜效果。
作者提供了代码、模型,感兴趣的朋友可以试一试。
项目地址:点击查看
3、Stanza
Stanza 是斯坦福 NLP 组开源的工具包,支持 60 多种人类语言的 NLP 代码库,支持中文简体、中文繁体、中国古文、英文、法语等等世界语言,甚至还有萨米语等不常见的语言。
Stanza 涵盖了多个自然语言处理任务,如分词、词性标注、依存句法分析、命名实体识别等。
Stanza 是基于 Pytorch 实现的 Pipeline,研究者在 112 个数据集上进行了预训练,但使用的是同一个模型架构。他们发现,同样一个神经网络架构可以泛化得很好,网络在所有语言上的性能都很好。
Stanza 一经开源,便引起了社区的热议,也登上了 Github 日榜。
项目地址:点击查看
4、libfacedetection
人脸检测可广泛应用于人机交互、安防监控、社交娱乐等领域,具有很强的实用价值,因此受到广泛关注与研究。
libfacedetection 算是元老级的人脸检测算法了,从 2015 年一直更新至今,一直保持着领域内不错的成绩。
它最大的亮点是能够在所有支持 C/C++的平台上编译运行,且速度快,精度高。
作者将预训练的 CNN 模型转换为静态变量后储存到了 C 文件里,项目依赖很少,仅仅只需要一个 C++ 编译器和常规依赖,就能在任何一个平台甚至嵌入式系统上编译并运行。
项目地址:点击查看
5、ReZero
深度学习在众多领域都取得了显著进展,但与此同时也存在一个问题:深层网络的训练常常面临梯度消失或梯度爆炸的阻碍,尤其是像 Transformer 这样的大型网络。
近日,加州大学圣迭戈分校的研究者提出了一种名为 ReZero 的神经网络结构改进方法,并使用 ReZero 训练了具有一万层的全连接网络,以及首次训练了超过 100 层的 Tansformer,它能够动态地加快优质梯度和任意深层信号的传播,效果都十分惊艳。
这个想法其实非常简单:ReZero 将所有网络层均初始化为恒等映射。在每一层中,研究者引入了一个关于输入信号 x 的残差连接和一个用于调节当前网络层输出 F(x) 的可训练参数α,即:
在刚开始训练的时候将 α 设置为零。这使得在神经网络训练初期,所有组成变换 F 的参数所对应的梯度均消失了,之后这些参数在训练过程中动态地产生合适的值。改进的网络结构如下图所示:
ReZero 主要带来了以下两个益处:
- 能够训练更深层神经网络
- 更快的收敛速度
项目地址:点击查看
6、Jittor
Jittor 中文名计图,它是清华自研深度学习框架,这也是首个来自中国高校科研机构的开源深度学习框架。
我用过的上一个来自高校的深度学习框架,还是Caffe呢。
与主流的深度学习框架 TensorFlow、Pytorch 不同,Jittor 是一个完全基于动态编译、使用元算子和统一计算图的深度学习框架。
基于 Jittor 开发的深度学习模型,可以实时自动优化并运行在指定的硬件上,如 CPU ,GPU。
为了方便更多人上手 Jittor ,开发团队采用了和 PyTorch 较为相似的模块化接口,并提供辅助转换脚本,可以将 PyTorch 的模型自动转换成 Jittor 的模型。
当然, Jittor作为一个新兴深度学习框架,在一些功能上,仍旧需要持续迭代完善。比如生态的建设,以及更大范围的推广,仍旧需要很多的努力。
项目地址:点击查看
7、GAN Compression
我们都知道,生成模型 GAN 是深度学习的重点发展领域之一。
在视觉相关的应用领域,GAN 往往带来一些惊人的视觉效果,例如换脸、人脸属性编辑、图像风格迁移等等。
但这类算法需要消耗巨量算力,实际应用受到一定的局限。
近日,来自 MIT 的研究者提出了一种用于压缩条件 GAN 的通用方法。
这一新技术在保持视觉保真度的同时,将 pix2pix,CycleGAN 和 GauGAN 等广泛使用的条件 GAN 模型的计算量压缩 9 倍~ 21 倍。
目前该研究的论文已被 CVPR 2020 大会收录,有关 GAN 压缩框架的 PyTorch 版实现也已开源。
项目地址:点击查看
快乐
1、这年头男人有多不容易
2、疫情期间,线上相亲的正确打开方式
财富
美股经过了长达近一个月的大跌,现在有所回升了。
3月24日,也就是本周二,道琼斯指数暴涨 11% 以上,此后一路飙升。
目前看,美股形成了一个上升趋势,后续如何不好判断,不过不管怎样,我也不会定投美股,毕竟定投美股也就相当于相信美国的国运,反比之下,我更想看到中国时代的到来。
上周的推送中,提到,这周我会操作一次,开始入场。
我的计划是,先争取入场2万,分批买入,跌点买点,佛系入场,然后开始新一轮的定投之旅。
3月24日,看A股大跌,我就买了2000多的 500ETF 和 1000多的创业板,无心插柳柳成荫,竟然还是在局部最低点买入了一手。
不过后续的发展跟美股不同,A股并没有一路飙升,上涨有些乏力,目前小赚一点。
A股后续涨跌对我来说,都无所谓,不过个人还是希望不要涨的太快,跌一跌挺好的,毕竟我才进去不到4000,这就开始大涨了,那就只能干瞪眼了。
想进场A股的朋友,可以开始行动了!
最后
本周的程序员欢乐送,到此结束,下周再会。
2020年3月30日 上午11:48 沙发
迷妹打卡
2020年3月30日 下午12:02 1层
@monika 公众号关注一波不迷路