大家好,我是 Jack。
今天又是分享开源项目的一天。
一、留痕
最近想训练一个符合某人说话风格的 AI,微信的聊天记录里就有着丰富的训练数据。
聊天记录是珍贵的记忆,也是每一场对话、每一个互动的真情流露。
想要拿到这些数据,无论是保存备份还是用于 AI 训练,手动拷贝都不现实。逛 Github 发现了这个不错的项目:留痕。
这是一名西北工业大学的学生开源的一个项目,作者这样说道:
使用方法非常简单:将手机的聊天记录迁移到电脑,然后使用WeChatMsg解密。
安卓:手机微信->我->设置->聊天->聊天记录迁移与备份->迁移-> 迁移到电脑微信;
iOS:手机微信->我->设置->通用->聊天记录迁移与备份->迁移-> 迁移到电脑微信。
迁移完成后重启微信,迁移前也最好提前备份一下聊天数据。
然后 clone 项目并安装依赖:
1 2 3 4 | # Python>=3.10 仅支持3.10、3.11、3.12,请勿使用其他Python版本 git clone https://github.com/LC044/WeChatMsg cd WeChatMsg pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple |
直接运行 main.py 即可解析数据。
1 | python main.py |
解析好的数据,可以做清洗,用于 AI 模型训练,也可以用于个人的数据分析。
项目地址:
https://github.com/LC044/WeChatMsg
有需要的自取。
二、Free Books
现在网上的开源资源越来越多,想要学习编程就有很多学习资料。
有些小伙伴想要自学计算机领域的知识,自学编程语言,问我有什么资料可以学习?
里面涵盖了从初学者到高级开发人员各个层次的书籍,包括但不限于编程语言、算法、数据结构、操作系统等方面的书籍和资料。
项目地址:
https://github.com/EbookFoundation/free-programming-books
这个里面的项目大多数都是英文的资料,学起来吃力的话,可以看看类似的中文项目:
https://github.com/justjavac/free-programming-books-zh_CN
内容同上,也都是很丰富:
引用的书籍和资料都是中文的。
又到了收藏等于学会的时候了!
好了,今天就聊这么多,我是 Jack,我们下期见!