程序员欢乐送(第7期)

2019年1月18日09:52:56 2 422 °C
摘要

程序员欢乐送:FlexPai全球首款柔屏手机、Flying Taxi飞行出租车、py12306抢票工具、“不可描述”的数据集、Pingo人脸检测
、PyOD离群点异常检测及可视化工具、pkuseg中文分词、薅羊毛

程序员欢乐送(第7期)

对于我来说,我一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、FlexPai全球首款柔屏手机

中国柔性OLED开发商柔宇科技(Royole)开发的全球首款柔屏手机亮相2019年国际消费电子展(CES),该柔性显示屏已经亮相投产。

柔宇科技开拓性地将柔性显示技术应用在手机屏幕上,不但统一了大屏与便携的矛盾需求,同时有效解决了智能手机碎屏问题。

程序员欢乐送(第7期)

程序员欢乐送(第7期)

不过目前仍然没有第三方测评发出,不知道具体性能如何。

官网地址:点击查看

2、Flying Taxi飞行出租车

Uber一直是叫车服务领域的巨头企业,利用打车服务“称霸”出租车行业。在其他出租车公司还在勤勤恳恳开拓市场,努力取悦消费者的时候,Uber已经将目标对准了天空。准备开发飞行出租车,打造城市空中交通,颇有些“夫骥骜之气,鸿鹄之志”的味道。

近日,Flying Taxi模型亮相于2019年国际消费电子展(CES)。

程序员欢乐送(第7期)

UberAir计划于2023年开始运营。

3、py12306抢票工具

每到过年,最煎熬的莫过于抢火车票了。往年有12306bypass的陪伴,抢票不是很难。但是今年再用突然发现IP各种被BAN,挂了代理抢到票软件直接崩溃。

不过最近发现了一个不错python抢票工具py12306,支持分布式、多账号、多任务购票,同时还有web管理界面。

订票成功页面:

程序员欢乐送(第7期)

Web管理界面:

程序员欢乐送(第7期)

项目地址:点击查看

4、“不可描述”的数据集

近日,Alexander Kim开源了一个内含20多万张“不可描述”图片的数据集。该数据一共有5个类别:

  • porn - pornography images
  • hentai - hentai images, but also includes pornographic drawings
  • sexy - sexually explicit images, but not pornography. Think nude photos, playboy, bikini, beach volleyball, etc.
  • neutral - safe for work neutral images of everyday things and people
  • drawings - safe for work drawings (including anime)

作者表示,这些数据集可以用来训练图像分类器,使用CNN做出来的分类器,分辨上述的5种图像准确度可以达到91%。

程序员欢乐送(第7期)

该数据集将图片链接存放在txt文件中,想用的话,需要使用脚本下载图片。数据可以用于色情图像检测,应用场景还是挺多的,比如对用户上传的图像检测其是否合法。

友情提醒:这个数据集千万别在办公室打开。

项目地址:点击查看

5、Pingo人脸检测

Pingo是一个Golang语言的人脸检测库,Pingo采用Pixel Intensity Comparison-based Object detection论文提出的方法进行人脸检测。

Pingo提供的API如果仅对图像进行检测,则不需要依赖任何第三方库。不过,如果要用网络摄像头实时检测,就需要安装python2和OpenCV了。

程序员欢乐送(第7期)

项目地址:点击查看

6、PyOD离群点异常检测及可视化工具

PyOD是一个对Outlier Detection (Anomaly Detection) 异常值检测(异常检测)的比较好的工具,该工具集成了多种算法的实现。

算法检测对比结果如下:

程序员欢乐送(第7期)

项目地址:点击查看

7、pkuseg中文分词

英文分词有Jieba,效果稳定。而对于中文分词,从前看过THULAC,它是由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能。

近日,北大也开源了一个中文分词工具pkuseg。

pkuseg特点如下:

  • 多领域分词。不同于以往的通用中文分词工具,此工具包同时致力于为不同领域的数据提供个性化的预训练模型。根据待分词文本的领域特点,用户可以自由地选择不同的模型。 我们目前支持了新闻领域,网络文本领域和混合领域的分词预训练模型,同时也拟在近期推出更多的细领域预训练模型,比如医药、旅游、专利、小说等等。
  • 更高的分词准确率。相比于其他的分词工具包,当使用相同的训练数据和测试数据,pkuseg可以取得更高的分词准确率。
  • 支持用户自训练模型。支持用户使用全新的标注数据进行训练。

目前,该工具包只支持python。

项目地址:点击查看

快乐

1、熬夜的原因

程序员欢乐送(第7期)

2、新浪年度锦鲤

一个大哥在新浪年会上中了一等奖60万,最为奇妙的是,他是经历前5个中奖人都不在场的情况下获奖的,可谓新浪年度锦鲤。

程序员欢乐送(第7期)

财富

春节快到了,这个时候可以薅的羊毛也多了,例如支付宝和银联的云闪付。

先说下云闪付,用银联云闪付App,扫一下「银联」或「云闪付」的标志,就可以领一个红包。

程序员欢乐送(第7期)

知道的最高金额是2019元,每天能领3个,到2月4号截止。

领了几天了,攒了10多块,受气不够啊。想试试手气的,可以直接扫描二维码领取:

程序员欢乐送(第7期)

支付宝的活动叫「体验金」,可以直接在支付宝内搜索「体验金」,然后可以领取一定数额的体验金,体验金是放到余额宝中的,薅的羊毛就是每天的利息。一般都能领到7000左右的体验金,不过体验只有3天,后面得重领。

个人感觉支付宝今年的活动没有那么实在了,还是银联云闪付更实在些。

最后

本周的程序员欢乐送,到此结束,下周再会。

weinxin
微信公众号
分享技术,乐享生活:Jack Cui公众号每周五推送“程序员欢乐送”系列资讯类文章,欢迎您的关注!
Jack Cui
ai

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:2   其中:访客  1   博主  1

    • avatar junxioage 来自天朝的朋友 谷歌浏览器 Windows 10 江苏省无锡市 电信 3

      大佬有没有ocr识别的demo

        • avatar Jack Cui Admin 来自天朝的朋友 谷歌浏览器  Android 8.0.0 MIX 2 Build/OPR1.170623.027 黑龙江省哈尔滨市 联通

          @junxioage 有啊,你github搜索下,应该很多。