Comments (10)
https://www.zhihu.com/question/43610705
方法一:
搜狗搜索出来的地址后面加上"&pass_ticket=qMx7ntinAtmqhVn+C23mCuwc9ZRyUp20kIusGgbFLi0=&uin=MTc1MDA1NjU1&ascene=1",再访问,原地址就出来了
from wechatsogou.
我的办法是关注特定领域的订阅号,通过微信网页版,用chrome的扩展定时刷所有公众号的推送文章
from wechatsogou.
其实想实现批量化肯定得用cookies转换 其余的fiddler/charles根本没法批量化
from wechatsogou.
[思路1]
😭😭😭也许我们可以仿照若快的思路,利用微信Bot来分发这些临时URL,由人工 / 按键精灵,在客户端内浏览器开 && 复制永久URL,然后回复给微信Bot, 微信Bot再上传服务器。
谷歌:微信 bot
今天在研究这个微信Bot Wechaty
[思路2]
如果我们能搞清楚,验证机制是什么,也许可以为浏览器植入插件/代码,伪装成“微信应用内请求”,来实现对于临时URL的访问,同时可以在浏览器内获取msg_link。
from wechatsogou.
貌似并没有变化,是不是已经失效了? @ax4
from wechatsogou.
@woocoder 有可能已经失效了
from wechatsogou.
不知大家有没有找到应对策略
from wechatsogou.
@ax4 这个方法确实已经失效了,得想一些别的策略啦
from wechatsogou.
pass_ticket=qMx7ntinAtmqhVn+C23mCuwc9ZRyUp20kIusGgbFLi0=&uin=MTc1MDA1NjU1&ascene=1
不行,毫无变化
from wechatsogou.
pass_ticket=qMx7ntinAtmqhVn+C23mCuwc9ZRyUp20kIusGgbFLi0=&uin=MTc1MDA1NjU1&ascene=1
不行,毫无变化
@heranly 不好意思哈, 我原来这个参数是2017年左右的时候思路。因为微信和搜狗方面改参数改过很长时间了,所以已经失效很久了不好意思哈。
感谢各位提供的关于已经失效的回复。
貌似并没有变化,是不是已经失效了? @ax4
@woocoder 有可能已经失效了
@ax4 这个方法确实已经失效了,得想一些别的策略啦
同时我已经很久没有在微信文章的爬取这块技术开发上活跃了, 不过基于cookie / 微信内置浏览器 的抓包应该还是可行的。我会推荐上面两位给出的思路:
我的办法是关注特定领域的订阅号,通过微信网页版,用chrome的扩展定时刷所有公众号的推送文章
其实想实现批量化肯定得用cookies转换 其余的fiddler/charles根本没法批量化
同时这些文章的临时链接,通过微信内核的浏览器是可以打开的(i.e. 微信手机版 / 微信PC版),这些临时链接放入到这些微信客户端内打开之后,微信的内置浏览器会完成解析链接和跳转的工作,所以如果要重新解析临时链接URL的话,甚至在链接已经过期了的情况下再次打开的话,可以考虑往客户端里面放的办法。
另外值得提醒的是,临时链接 -> 永久链接 -> 爬完之后还能访问网页内容
的思路,在开发上也可以用一个效果相同但是另一种思路是:临时链接 -> 获取HTML/PDF输出较长时间保存 -> 可以再次阅读
,文字和样式的保存没有问题,唯一难保存的是文章当中的图片,因为原创文章和原创公众号会保护这些图片。
所以需要看你开发目的和期待得到的结果是什么,然后适当地“曲线救国”吧。祝顺利!
from wechatsogou.
Related Issues (20)
- 现在还可以获取微信的profile_url链接吗?
- 为什么报没有API接口的错误? HOT 2
- 现在import 就报错找不到模块是什么问题
- 请问这个项目还可以用吗,还在维护吗 HOT 1
- 获取不到公众号文章链接,profile_url为空 HOT 1
- bug: ModuleNotFoundError: No module named 'werkzeug.contrib' HOT 2
- 这代码咋使用,运行test里面的文件吗,通过不了,报下面错误,大佬怎么操作的
- 怎么获取微信公众号的biz
- [Bug report]有依赖损坏 HOT 1
- 关于验证码解决的问题。就是禁止验证码出现 HOT 7
- 网络请求太频繁,微信觉得框架异常,所以会出现验证码 HOT 1
- 模块已经安装,报错ModuleNotFoundError: No module named 'werkzeug.contrib' HOT 4
- 怎么解决验证码问题 HOT 4
- get_gzh_article_by_history文章列表为空 HOT 2
- 无法解析带有*的文章链接 HOT 1
- python3.8 安装完包执行报错 HOT 2
- ws_api.get_gzh_info 调用这个接口报这个错误 ('WechatSogouAPI get img', <Response [403]>)
- 运行demo没有反应,直接退出了 HOT 1
- 博主有联系方式吗?想谈合作~ HOT 2
- ('WechatSogouAPI get img', <Response [403]>)加上代理也一样报,如何解决403? HOT 4
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from wechatsogou.