程序员欢乐送(第13期)

2019年3月15日09:00:00 6 663 °C
摘要

程序员欢乐送:视频分析数据集、微信公众号排版编辑器、Pytorch扩展库、DeepFashion2数据集、Graph Embedding、S³GAN、模拟登陆

程序员欢乐送(第13期)

对于我来说,我一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、视频分析数据集

现在,清华大学和美图开源了教程类行为视频数据集COIN(COmprehensive INstructional video analysis),内含11827条教程类视频,涉及日常生活12个领域里的180个任务的视频内容。

所谓教程类视频,一般都集中在美食、美妆和家装DIY等领域。比如,美妆博主教你化妆、美食博主教你做披萨,都属于教程类视频的范畴。

美图表示,COIN为业界规模最大最多样性的教程类视频数据集。

以后,在复杂场景下视频动作时序定位、视频行为分析与理解问题的研究中,不妨试试这套数据集。

数据集的视频信息以JSON格式存储, 可以自行解析下载,并且COIN方也提供了网页的数据标注工具。

程序员欢乐送(第13期)

项目主页:点击查看

数据集项目地址:点击查看

标注工具项目地址:点击查看

2、微信公众号排版编辑器

平时用Markdown写笔记,想在微信公众号发布这篇笔记,如果没有好用的排版工具,就需要手动编辑,长期编辑很痛苦。

Github用户lyricat发布了wechat-format工具,解决了这个痛点。也可以使用在线编辑工具,编辑后直接将固定样式的结果粘贴到公众号编辑器即可。

程序员欢乐送(第13期)

项目地址:点击查看

3、Pytorch扩展库

随着人工智能发展,很多人都听说过机器学习、深度学习、卷积神经网络这些概念。但图神经网络,却少有人提起。

卷积神经网络和图神经网络有什么区别?

卷积神经网络研究的对象是限制在Euclidean domains的数据。什么是Euclidean data?Euclidean data最显著的特征就是有规则的空间结构,比如图片是规则的正方形栅格,比如语音是规则的一维序列。而这些数据结构能够用一维、二维的矩阵表示,卷积神经网络处理起来很高效。

但是,我们的现实生活中有很多数据并不具备规则的空间结构,称为Non Euclidean data。比如推荐系统、电子交易、计算几何、脑信号、分子结构等抽象出的图谱。这些图谱结构每个节点连接都不尽相同,有的节点有三个连接,有的节点有两个连接,是不规则的数据结构。

最近,开源了一个叫PyTorch Geometric,简称PyG的Pytorch扩展库,里面聚集的算法就是26项图网络研究代码。

如果对图神经网络感兴趣不妨看看这个项目。

程序员欢乐送(第13期)

项目地址:点击查看

4、DeepFashion2数据集

DeepFashion2是一个时尚数据集,包含了来自商业购物商店和消费者的49.1万张图片,里面涉及13种流行服饰,共计80.1万件服饰,并且每一件都有标注标签,例如类别、角点、边界框、风格等。

程序员欢乐送(第13期)

项目地址:点击查看

5、Graph Embedding

网络表示学习(Graph Embedding,也叫Network Embedding)是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题。了解图嵌入能帮助理解图数据的处理过程,拓展思考问题的思路(传统ML基本都是table类型的数据)。

Github有个项目就是针对网络表示学习的教程,包括算法原理讲解和代码复现。

程序员欢乐送(第13期)

项目地址:点击查看

6、S³GAN

GAN网络一直很火,从近期的CVPR产量中便可看出。2019年的CVPR High-Fidelity Image Generation With Fewer Labels提出了一个S³GAN网络,生成的图像更加逼真。

看下FID(Frechet Inception Distance)评分指标,分值越低,就表示这些照骗,越接近人类认识里的真实照片。S³GAN是8.0分,而之前的BigGAN是8.4分。

同时,S³GAN一个优势在于只用了10%的人工标注数据。而老前辈BigGAN,训练所用的数据100%是人工标注过的。

不过目前S³GAN的pretrained model并没有提供。

程序员欢乐送(第13期)

项目地址:点击查看

7、模拟登陆

看过我网络爬虫教程的朋友对于模拟登陆应该并不陌生,网络爬虫作为数据获取的手段之一,经常一道的一种问题就是有些数据需要模拟登陆后才能获取。

Github用户CriseLYJ发布了一个名为awesome-python-login-model的开源项目,这个项目介绍了如何用 Python 登录各大网站,并用简单的爬虫获取一些有用数据,目前该项目已经提供了知乎、B 站、和豆瓣等 21 个网站的登录方法。

当然,这些代码是作者收集的,不排除有一些代码需要调试才能跑通,网络爬虫代码时效性弱一些也属正常。

程序员欢乐送(第13期)

项目地址:点击查看

快乐

1、分享迷惑

程序员欢乐送(第13期)

2、好朋友对话不用打字

程序员欢乐送(第13期)程序员欢乐送(第13期)

财富

今天聊聊货币基金吧,什么是货币基金?

货币基金是投资货币市场的基金。

好抽象啊!

那换个说法:

普通人去银行存钱,手里拿着几万或者十几万,拿号、排队、一看当期的利息3%,正犹豫存不存的时候,发现对面银行柜员正笑眯眯地看着自己:您还存吗?

潜台词是:不存我叫下一位了!

如果是土豪去存钱呢,拎个几千万,往贵宾室一跷二郎腿,对面业务员也是笑盈盈地看着你:您要存多久呢?要是觉得利息太少了的话,我们给您来个量身定做的大额存单吧,您看要不要考虑一下?

这就是差别,对普通人来说的“一大笔钱”,在银行眼里其实是蚊子腿,真正大笔资金才有议价权。

所以,货币基金就应运而生了!

哦,原来货币基金是把很多人的钱集合起来,再存到银行去啊!

你可以这么理解,但实际上,货币基金还会投资于:国债、票据、同业存款等安全系数高,收益稳定的产品中。

货币基金没有风险吗

既然货币基金都是投资于这些安全系数高的产品中,那货币基金是不是稳赚的?没有风险吗?

货币基金风险很小,但不代表没有风险。

历史上有三只货币基金曾经出现负收益的情况:

2006年6月8日的泰达荷银货币基金(现在叫“泰达宏利货币A”):

程序员欢乐送(第13期)

2006年6月9日的易方达货币A

程序员欢乐送(第13期)

这两只基金之所以出现负收益,是因为当时正值新股密集发行期,很多人将原本放在货币基金里的钱赎回,用来申购新股,造成了当天的巨额赎回现象。

基金经理为了应付大规模赎回,不得不抛售手中的债券,正好当时又碰上债市低迷,于是便出现了亏损。

最近的一次货币基金负收益出现在2016年的7月18日,兴业鑫天盈货币A

程序员欢乐送(第13期)

这只基也是因为出现了大规模赎回现象。

上文不是提到过,货币基金会集合大家的钱,去存到银行做一个相对高息的大额协议存款吗。

遇到这种大规模赎回,基金经理就不得不中止部分协议存款以应对流动性压力,但这部分提前支取的金额只能按照活期来算,活期利息哪有协议利息那么高呢,所以就出现负收益咯。

不过,大家不用担心,出现这种负收益现象的概率很小,而且大多都是因为短期的大规模事件导致货币基金的收益异常,长远来看,货币基金仍然是一种风险很小,非常安全的理财产品!

货币基金的两个衡量指标:

七日年化收益率和万份收益

七日年化收益率:

是货币基金最近7天的平均收益水平,比如某只货币基金的7日年化收益率是4%,就是假设这只货币基金是按照过去7天的挣钱速度换算出来的一个收益率。

但真正一年过后,收益率是不是4%,还不一定。

万份收益:

就是基金公司每天公布的,当天每一万份基金的收益金额。因为货币基金都是一元一份,所以万份收益就是你一万块钱每天可以获得的收益。

七日年化收益率越高的货币基金就越好吗

因为每天的万份收益变化较大,所以大家一般会拿七日年化收益率的数据来对比两只基金。

那意思是七日年化收益率越高的货币基金就越赚钱吗?

并不是!

前面在说货币基金的负收益的时候,大家知道大额赎回会对货币基金的短期收益有比较大的影响。

反之,短期内赚到大钱,也会对货币基金的短期收益产生较大影响。

很多基金经理为了配合货币基金的宣传需要,会在短时间内将手中收益高的产品集中抛售,造成货币基金短时间内的7日年化收益率达到很漂亮的数字,比如6%,甚至更高。

当你被这漂亮的数字吸引,而开开心心地把钱放到这只货币基金的时候,小二想起了江湖上流传的一句话“出来混,终究是要还的”,这只基提前透支了它手中的好牌,后续的收益一日不如一日,而你却还在傻傻地等着他回来的那一天……

那到底要怎么挑选货币基金呢?

两个参考维度:

1、规模越大越好

一方面在投资产品时更有议价能力,另一方面,规模越大,应对大规模赎回时,对收益的影响就越小。

2、越成熟越好

老基金一般运作较为成熟,具有一定的投资经验,持有的高收益率品种较多。选择一只成立时间长、业绩相对稳定的货币基金相对来说较为明智。

总之一句话:老司机,稳!

货币基金解释转自:点击查看

最后

本周的程序员欢乐送,到此结束,下周再会。

weinxin
微信公众号
分享技术,乐享生活:微信公众号搜索「JackCui-AI」关注一个在互联网摸爬滚打的潜行者。
Jack Cui

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:6   其中:访客  3   博主  3

    • avatar junxioage 来自天朝的朋友 谷歌浏览器 Windows 10 江苏省无锡市 电信 3

      终于发了

        • avatar Jack Cui Admin 来自天朝的朋友 Safari浏览器 Mac OS X 10_14_3 北京市 百度网讯科技联通节点

          @junxioage 感谢支持

        • avatar Danboard 来自天朝的朋友 谷歌浏览器 Mac OS X 10_13_6 江苏省 联通 2

          能介绍下混合型基金 股票型基金和股票收益之类的吗

            • avatar Jack Cui Admin 来自天朝的朋友 Safari浏览器 Mac OS X 10_14_3 北京市 百度网讯科技联通节点

              @Danboard 股票行基金和混基在前面写过一些,股票后面有时间也会写。感谢支持。

            • avatar 蓝亚之舟 来自天朝的朋友 谷歌浏览器 Windows 10 北京市 北京宽带通电信技术有限公司 2

              博主大大,请问你编辑博客的时候,是用markdown格式编辑的,还是WordPress自带的编辑器啊?

                • avatar Jack Cui Admin 来自天朝的朋友 Safari浏览器 Mac OS X 10_14_3 北京市 百度网讯科技联通节点

                  @蓝亚之舟 不是,我用的wp自带的编辑器。