大家好,今天继续聊聊科技圈发生的那些事。
一、雷军的简历
最近小米汽车的一轮疯狂刷屏也让老总雷军再火了一把。比如,小米汽车首批交付,雷军亲自开车门,并合影留念,被网友戏称30万购车款花得真值。最近又有人整理了雷军的简历,一起来欣赏下:
说回雷军开挂一般的人生,我们就看其中比较震撼的几项:
- 710 分满分的高考,考了 700 分(网传,估计为假,也有说584),不过确实两年修完所有学分,拿完所有奖学金
- 大三,纯靠兼职写代码赚了 100 万
- 编写的程序被搬进教材
- 被湖北省公安厅请去讲解反病毒技术
- 28 岁出任金山软件总经理
- 31 岁创办卓越网,后于 2004 年以 7500 万美元出售
- 38 岁迷茫低谷时,卡里剩下冰冷的 40 亿
- 41 岁创办小米
作为歌唱家发布作品《Are U OK》- 50 岁,小米公司上市
一直不能理解 28 岁出任金山软件总经理是什么段位,直到我 28 岁...
二、SearXNG
相信很多游戏玩家们都在网上看到过一些关于 Steam 平台的小段子。比如,新玩家入坑端游,想体验一下 Steam,一搜,却搜出来一堆坑人的“ Steam 管家”。还没弄清楚状况呢,已经掉进盗版的连环坑了。
哈哈,虽然对于我们这种“游戏老鸟”来说,这种事儿已经不太可能发生了(毕竟辨认很简单,下载完打不开的才是真 Steam)。
但我们如何避免这种搜索引擎带给我们的广告陷阱呢?
SearXNG 是一款免费开源的互联网元搜索引擎。SearXNG 聚合了 70 多个搜索服务的结果,简单来说,就是在你提供搜索请求时,同时开 70 多个引擎帮你搜索!
另外,SearXNG 可以有效的保护个人隐私。从搜索请求中删除私人数据有以下三种形式:
- 从发送至搜索服务的请求中删除个人数据
- 不通过搜索服务转发来自第三方服务的任何内容
- 从进入结果页面的请求中删除私有数据
最令人舒适的一点是,SearXNG 不提供任何广告或是跟踪内容。在使用过程中,用户感受不到任何广告成分。而且引擎不会将搜索记录等隐私行为记录转发给第三方。
总的来说,这就是一款 Pro 版本的搜索引擎。首先没有广告,能集合各大主流搜索引擎的搜索结果,内容丰富完整,还能有效的保护用户个人隐私。
项目的搭建需要一台云服务器,而且不太适合在国内的服务器搭建,有一定的上手难度,但是使用体验应该还是很不错的。感兴趣的小伙伴可以从项目的主页深入了解看看。
项目地址:
https://github.com/searxng/searxng
三、video-subtitle-remover
当我们在观看一些动漫、电视剧的时候,通常会碰到一个问题:
某一个分镜的某个角色特别好看,我想把他/她截下来当头像,但是下面字幕挡住了一部分,去掉那部分的区域,又感觉比例什么的怪怪的,咋办?
比如,我想做到下面这样:
video-subtitle-remover (VSR) 是一款基于 AI 技术,将视频中的文字去除的软件。只需要提供一个原视频作为输入文件,该项目就能帮你去掉里面的文字、水印、字幕等。而且,这是一个有 GUI 界面的软件!
项目的功能很强大:
- 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件
- 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除)
- 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置)
- 支持全视频自动去除所有文本(不传入位置)
- 支持多选图片批量去除水印文本
项目基于FFmpeg框架实现,使用 Python 的 subprocess 模块执行 FFmpeg命令。通过调用 FFmpeg, VSR 能够检查视频流信息,识别文字,然后直接从原视频中摘除。
项目本地可以部署运行,当然,需要一块 NVIDIA 显卡,显卡性能越强,实现越快。作者团队提供了懒人包,项目的主页也附上了很多常见的使用问题。参考作者的这些引导,相信部署起来并不困难。
项目已开源,感兴趣的小伙伴可以自己体验一下。
项目地址:
https://github.com/YaoFANGUK/video-subtitle-remover
四、InstantStyle
InstantStyle,一款由 InstantID 团队开发的新项目。这是一个框架,可以从参考图像中分离风格和内容,进行图像生成。InstantStyle 支持不同的生成方式,包括提供风格图片和内容图片,以及提供风格图片和内容说明文字。
项目致力于解耦风格与内容,防止样式泄露。我们先来看看 InstantStyle 的概述:
InstantStyle 有11个具有 SDXL 的 transformer 块,4个用于下采样块,1个用于中间块,6个用于上采样块。第4块和第6块分别对应于布局和样式。大多数时候,第6个区块足以捕捉风格,只有在某些情况下布局是样式的一部分时,第4个才重要。
在这张图上可以看到,我们提供了风格参考图片(不同的图片)和源图(人像),InstantStyle 帮我们生成了相应风格的人像图,比如油画《星空》风格的人像。
我们也可以提供风格参考图片,然后再提供说明文字(也就是我们常看到的prompt),InstantStyle 也可以帮我们生成一系列图像。
作者团队在 IP 适配器(SDXL)上进行了全面的实验,以分析每个注意力层对图像特征的影响。up_blocks0,attents.1和down_blocks.2,attents.1分别是最具代表性的层次、控制风格和空间布局。
作为一个通用框架,InstantStyle 已经可以用很高效的方法分离参考图像的内容和风格。我们可以进一步等待后续发展更新。
项目地址:
https://github.com/InstantStyle/InstantStyle
好了,本期的内容就是这么多,我们下期再见!