Giter VIP home page Giter VIP logo

google_image_searcher's Introduction

Google 以图搜图

test

旨在通过 Google 或者相关镜像网站达到获取现有图片的相似图片

请使用最新提交代码,见 v6v6 中直接向接口 POST 数据,速度较之前大幅度提升 🎉

另外也使用 Go 进行了实现(点这里),速度更快:tada:,并且提供二进制可执行文件


旧版本

1. requirements

  • selenium
  • beautifulsoup4
  • requests
  • Chrome & webdriver(under the Python Script folder)

2. How does it work

The mirror website is : https://images.wjbaike.site/imghp (目前该镜像网站会自动重导向到google.com.hk,需要能够访问google才能进行搜索, 可使用VPN或者 浏览器插件)

Its main steps are as follows:

3. How to use

  1. 在main.py 同目录下新建一个upload文件夹(或者可以在初始化的时候指定自己的上传文件夹名称)
  2. 在upload文件夹中上传自己的图片
  3. 运行main.py,即可在同目录下的download(可自定义)文件夹中获取搜索到的图片(暂且仅获取搜索页面的第一页)

⭐ 建议使用最新版本 ⭐

4. New features

  • version 2

    • 自定义睡眠时间

      根据用户的网络情况,用户可以更改爬取网页时等待网页加载完全的时间,默认为6s

    • 支持两种模式(以后版本中已经撤销)

      • 文件模式

        图片文件直接放在upload文件夹下面

      • 文件夹模式

        图片以不同的文件夹位于upload文件夹下面,即upload文件夹下面的文件夹里面包含图片

  • version 3

    • 自动识别上传文件夹下的为包含图片的文件夹还是直接为图片,但目前仅支持upload文件夹中的文件夹必须是包含图片,如果包含其他的文件夹,不能再进行递归
  • version 4

    • 自动递归识别文件夹中的内容,无论图片位置如何放置,皆可进行搜索
  • version 4.1

    • 在version 4 由于镜像问题进行改进,并添加进度条显示,由于含有插件Ghelper, 速度大幅度提升
  • version 5

    • 将配置放置在json文件中,更加灵活

version 自动识别图片类型文件 upload模式(file/folder) 递归upload文件夹下载图片
1
2
3
4
5 ✔(可自定义)

更新:

2020/6/26: 镜像网站可以正常访问,点击这里

google_image_searcher's People

Contributors

junhaideng avatar yangn0 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

google_image_searcher's Issues

2023/04/08,v6方法似乎失效

我尝试用v6 python的代码去跑,发现得不到图片了(也没有报错)
现在用google.com进去的以图搜图似乎是lens.google.com这个东西,不知道是不是这个的原因。

顺便请教一下大佬的分析思路(我现在用selenium实现了以图搜图效果,但是不太满意,打开webdriver很慢)

setting.json如下:

{
  "upload": "D:/study/GWorks/test_img/",
  "download": "D:/study/GWorks/save_img/",
  "separate": true,
  "extention": [
    ".bmp",
    ".jpg",
    ".jpeg",
    ".tif",
    ".tiff",
    ".jfif",
    ".png",
    ".gif",
    ".iff",
    ".ilbm"
  ],
  "url": "https://www.google.com/searchbyimage/upload",
  "getOriginPic": false
}

最后save_img里每个图片文件夹内都只有相同的一张图,如下所示:
0

我还查看了main.py中analyse()函数里的soup变量。soup.text的内容如下:

Google 搜尋如果系統沒有在數秒鐘後將您重新導向,請按一下這裡。無障礙連結跳至主內容無障礙說明無障礙工具意見回饋 ×按下 / 鍵即可跳至搜尋框 刪除刪除回報不適當的預測查詢字串 搜尋模式全部圖片更多工具 以圖搜尋功能無法使用,請稍候幾小時再試一次。 頁尾連結台灣台中市 - 根據你的 IP 位址 - 更新位置說明提供意見隱私權服務條款

配置settings后出现KeyError: 'getOriginPic'

你好!
感谢你的项目,我正在尝试使用这个来系统性搜索并下载相关图片。
目前我配置的是google_image_searcher_v6,系统环境是Windows 10,使用的是Python 3.8。测试图片文件夹(upload)如下:
image
我似乎能够成功跑通settings.py(仅将mirror变为False,因为在墙外)。
image

但是,我遇到了如下问题:
image
请问这里的settings是一个package还是指的是settings.py?
如果是前者,settings这边显示我无法安装。
image

请问问题出在哪里(文件夹配置和settings问题)呢?可能有什么解决方法呢?
感谢帮助!
顺祝新年快乐~

TimeoutException

helllo, 您好,我用了您的代码,出了点bug,能看看这是啥问题吗
<ipython-input-22-6f0399232e41> in upload_img_get_html(self, file) 83 condition_2 = expected_conditions.visibility_of_element_located( 84 (By.ID, "qbug")) ---> 85 WebDriverWait(driver, timeout=200, poll_frequency=0.5).until( 86 condition_2)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.