Giter VIP home page Giter VIP logo

qq-mht2html's Introduction

QQ MHT2HTML

用于转换QQ导出的MHT文件到单独的html和图片文件。采用Compose Desktop作为GUI库。

谨此纪念许多被炸的老群。

功能

  • 多线程转换图片, 较快 (因有大量随机读写强烈建议用SSD作为输入输出目录)
  • 支持多群组/联系人导出的mht文件, 根据不同群组/联系人拆分文件
  • 时间戳转换, 方便搜索(ISO格式)
  • 样式压缩
  • 支持自定义分页行数, 默认7500行

缺点/待改进项

  • 基于JVM, 比较吃内存

测试数据

v1.3.0 及以上版本能更好利用多核心, 相较以往版本有20%以上的速度提升

环境: Desktop [email protected](6C6T)/32G@3200MHz/Kioxia CD6 SSD, Win10 21H2, Windows Defender 主动防护关

输入: 183GB, 内含45万张图片, 约600万行聊天记录

耗时: 总耗时~596s


环境: Laptop Dell Precision 3581 i7-13800H@50W(14C20T)/32G@4800MHz/Phison E13T SSD(R)+WD SN740 SSD(W), Win10 22H2, Windows Defender 主动防护关

输入: 同上

耗时: 总耗时~326s




v1.2.x 版本测试数据

环境: Desktop [email protected](6C6T)/32G@3200MHz/Kioxia CD6 SSD, Win10 21H2, Windows Defender 主动防护关

输入: 183GB, 内含45万张图片, 约600万行聊天记录

耗时: 总耗时~740s


环境: Laptop Dell Precision 3581 i7-13800H@50W(14C20T)/32G@4800MHz/Phison E13T SSD(R)+WD SN740 SSD(W), Win10 22H2, Windows Defender 主动防护关

输入: 同上

耗时: 总耗时~506s


环境: 同上

输入: 27GB, 内含7万张图片, 约36万行聊天记录

耗时: 总耗时~110s


环境: Desktop i9 12900K/32G@6000MHz/WD SN850 SSD, Win11 21H2, ESET 主动防护关

输入: 同上

耗时: 总耗时~60s


环境: Desktop R9 7950X/64G@4800MHz/Samsung 980pro/PM983 SSD, Win10 21H2, Windows Defender 主动防护关

输入: 同上

耗时: 总耗时~45s


环境: 同上, Windows Defender 主动防护

输入: 同上

耗时: 总耗时~80s


环境: Desktop [email protected](6C6T)/32G@3200MHz/Kioxia CD6 SSD, Win10 21H2, Windows Defender 主动防护关

输入: 50GB, 内含10万张图片, 约80万行聊天记录

耗时: 总耗时~150s


环境: 同上, Windows Defender 主动防护

输入: 同上

耗时: 总耗时~210s


环境: Desktop i5-9400F(6C6T)/16G@2666MHz/Samsung 980pro SSD, Win11, Windows Defender 主动防护关

输入: 同上

耗时: 总耗时~230s


环境: Laptop Tongfang CODE-01 R7-4800H@54W(Max)(8C16T)/32G@2400MHz/Phison E13T SSD, Win10 21H2, Windows Defender 主动防护关

输入: 同上

耗时: 总耗时~270s


环境: Micron 3400 SSD, Windows Defender 主动防护, 其余同上

输入: 同上

耗时: 总耗时~240s


环境: 同上, Windows Defender 主动防护

输入: 同上

耗时: 总耗时~210s


环境: Laptop Dell Latitude 5401 i7-9850H(6C12T)/24G@2400MHz/WD SN520 SSD, Win10 21H2, Windows Defender 主动防护关

输入: 同上

耗时: 总耗时~230s


环境: Desktop Dell Optiplex 3060MFF [email protected](2C2T)/16G@2133MHz/Samsung SM961 SSD, Win10 1809, Windows Defender 主动防护关

输入: 同上

耗时: 总耗时~680s

参考

qq-mht2html's People

Contributors

gyakkun avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar

qq-mht2html's Issues

导出的html不全,不知道什么原因

用老版的QQMhtToHtml.exe,可以导出近100m的html文件,这个就只有6m多一点,粗看了下,所有的群聊记录都没导出来,请问可能是什么原因呢,不知道是不是设置问题?

想问一个关于qq导出的问题

我有200多G的历史记录,十年没删除了,我想全部导出来,结果前面导出很快,后面就很慢,已经放在固态硬盘了,好像是图片转base64计算很慢,导出十几天才120G左右,一天大概就跑几G,有没有更快的办法

你好,希望可以添加忽略群组导出的功能(No Group)

你好,很棒的项目,如果有空的话,希望能添加忽略群组导出的功能(No Group),只想要联系人的聊天记录。
十分感谢。

看了下,我这边导出的与之相关的关联项是:
消息分组:我加入的群聊
消息分组:我创建的群聊
消息分组:我管理的群聊
消息分组:已退出的多人聊天

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.