好想抛弃百度，让机器仅仅根据验证码本身来学习

Question

巨大而有趣的挑战再次浮出水面

zhaipro · Answer

大体思路就是仅仅告诉机器我们12306验证码识别的游戏规则。
已知规则：

一张验证码需要寻找且只寻找一种图片。

zhaipro · Answer

关键是我们如何定义损失函数呢。
理论上有实现的可能吗？

zhaipro · Answer

以违反游戏规则来计算损失，例如：

它说验证码中没有我们要找的图片，我们就给它扣分。
它说验证码中

zhaipro · Answer

哎，先想办法收集训练集吧。
10K张验证码够用吗？npz文件都1G啦。
最终决定用2K张验证码。

zhaipro · Answer

绝对的端到端训练

crazydogen · Answer

你可能需要聚类或者其他无监督的技术目前来讲半监督的技术(需提供部分带标签数据)可能更适合你此外有趣的是百度图片搜索文字得到的图片其实就可以充当训练集

from easy12306.

crazydogen · Answer

<p dir="auto">不如这样  既然文字也是用图片做载体  那么你的网络直接输入有文字的图片和验证码图片 输出值为三项 第一项(0，1) 第二, 三项为具体位置(row: 2; column:

zhaipro · Answer

你可能需要聚类或者其他无监督的技术目前来讲半监督的技术(需提供部分带标签数据)可能更适合你此外有趣的是百度图片搜索文字得到的图片其实就可

zhaipro · Answer

我突然开始觉得，我可能无法抛弃百度，最多叫出师。

zhaipro · Answer

如果机器说要找的是打字机，而它只要在图片中找到一个打字机我就不给它扣分，如果它不总是重复说其它全是打字机，我还在给它加点分。

loss

zhaipro · Answer

原来概率论是用来定义损失函数的，在深度学习中。

crazydogen · Answer

<p dir="auto"><a target="_blank" rel="noopener noreferrer nofollow" href="https://user-images.github

zhaipro · Answer

哇，画的好漂亮，我就不行啦。

我现在的思路差不多，两个输入，文字部分和图片部分（2*4），两个输出，不过都是softmax。重点是损失函

zhaipro · Answer

我不行啦，先降低难度，准备先抛弃相似图搜索算法，目的是学习深度学习。

crazydogen · Answer

<p dir="auto">个人理解 目前深度学习的算法需要引入标记数据才有较高精度， 这个task来说有点像两种图片的匹配并输出文字图在验证码图中的位置。 可以理解成将两个图片输入后编码为一个vec

zhaipro · Answer

我觉得是，如果提供的信息量太少会导致凸优化很容易收敛到局部最优解，甚至根本找不到路线。
之前让卷积网络直接学习有噪音文字图时，就像是找不到路线一样无法收敛。必须要先

Huangvivi · Answer

emmm 谷歌搜图提供的数据源与标签的吻合性要比百度的高呀，推荐谷歌

zhaipro · Answer

主观感受

给了模型1800*8张图片，虽然数据量跟原来差不多，但信息量不足。想要训练好一个模型就必须提供足够的训练集。

zhaipro · Answer

哈哈哈555，我又买了强化深度学习相关的书籍。

crazydogen · Answer

我觉得是，如果提供的信息量太少会导致凸优化很容易收敛到局部最优解，甚至根本找不到路线。
之前让卷积网络直接学习有噪音文字图时，就像是找不到

zhaipro · Answer

啊，并不是噪音本身带来的影响，是因为我没有人工标注，而是借用了相似图搜索。

例如：

zhaipro · Answer

有了新的想法，如果它只会说验证码中让找的是打字机，那下次训练它只要一说要找的是打字机我就给它扣分，看它以后还敢不敢。

期望文字识别结果分

YwEwanHuang · Answer

自己学找东西, 可以用Reinforcement Learning (RL)了吧

zhaipro · Answer

一致性约束和同变性约束？

好想抛弃百度，让机器仅仅根据验证码本身来学习 about easy12306 HOT 24 OPEN

Comments (24)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent