说个我的IT方面的小趣事。 这还是我不做IT之后的事情。在Kijiji上要发布广告,
做点小生意,有那么个三四十个商品,每个商品一个post,开始几周都是手动输入,一个post再快三分钟,四十个广告就要发两个小时,kijiji的广告几年前是不能repost的,两个月失效之后就要重新输入。不仅如此,一个广告如果是热门,半天时间就掉到十页以后,淹入茫茫大海了,如果要被搜到在前列,就要删了重发。一个用户在某个分类是有数量限制的,而且类似的广告会自动被删除。

手动输入几天我受不了了,开始琢磨怎么办。 想到用selenium webdriver,自动化测试编程。 数据是自动从一个文件目录里读取,图片,价格,商品描述等等都是自动填写,完全模仿人的输入速度方式。一夜之间我创建了几十个kijiji用户名,每个用户名下发布二三十个商品,相同商品随机价格小数点后面自动变化,免得会被发现重复。 每天晚上机器删除昨天的广告,重新发布,一晚上在不同的城市发布成百上千的广告,而且使用多线程 ;) 。

我太嚣张了,被kijiji盯上了,收到邮件问我要不要使用他们商业服务,收费可以发布商业定制的广告,说他们发现我大量发布广告。我不舍得,不理。但是开始警惕,发布广告开始使用VPN,每个账号使用不同IP登陆.

。。。。。。

打字太累,懒得说过程了,长话短说,他们不停修改网站,我也不停修改程序,开始还解决了一些问题,半年后完全不行了。,。最后的结果是我手动登陆输入没问题,但是一启动selenium打开的浏览器就是空白, 怎么检查TCP/IP都没用,看了一些文件,说是这几年网站的 anti bot 技术也在升级。

这里有讨论,但是提供的办法都没用。

https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver/41220267

如果IT的知道网站有什么安全漏洞,找几个稍微专业的怎么都能解决了,小用户的小技俩没啥用的。

我现在又是手动发广告,或者付钱给google ads了。

-ysysning(三果) 2021-10-14
说个我的IT方面的小趣事。 这还是我不做IT之后的事情。在Kijiji上要发布广告,
你终于让我知道网上那些垃圾广告的伎俩了,谢诚实!
-liaison01(红桃A) 2021-10-14
我不觉得你现在才知道。
-ysysning(三果) 2021-10-14
好东西,可以在肉联自动发帖,点赞吗?
-world1(上海回民) 2021-10-14
嘿嘿嘿~~~
-ysysning(三果) 2021-10-14
肉联那个以前比较简单,点赞的时候用不同的hash值就可以点了,不知道现在有没有改进
-benii(惊坐起) 2021-10-14
三果真能干👍
-gracexueli(懒猫) 2021-10-14
嗨,为了谋生。
-ysysning(三果) 2021-10-14
是能干。但对付你这种手段的正常方法是CAPTCHA,reCAPTCHA,不知道它们干嘛不用。
-mantis(虾钟钱) 2021-10-14
哈哈 这个他们后来用到了,我可以对付的。就是当这个出现的时候,我的电脑自动停止,发出警告声,我就回到电脑前手动选消防栓,信号灯,斑马线...然后程序继续.....
-ysysning(三果) 2021-10-14
👍半自动,我现在也是这种方法,LOL。你的贴子里哪个检测webdriver的方法讨论很好。你也可以考虑试一下替换执行码里的特征字符串。
-mantis(虾钟钱) 2021-10-14
都试过了,不好用。彻底放弃了.
-ysysning(三果) 2021-10-14
很久以前,为了对付类似的东西,我做了个类似OCR的东西,但对付captcha有困难。
-lifyy(_) 2021-10-14
captcha只能手动了
-ysysning(三果) 2021-10-14
需要AI,应该能training好。
-lifyy(_) 2021-10-14
captcha也上 AI ,两个AI斗智斗勇。
-ysysning(三果) 2021-10-14
再玩下去,年老的人上个网就被CAPTCHA搞死了。我现在就常常图片看不清,稀里糊涂就弄错了。
-mantis(虾钟钱) 2021-10-14
确实是,captcha或者类似的技术让真人都不一定每次都能答对,尤其是找图片那种,甚至有时候图片本身就模模糊糊的。
-lifyy(_) 2021-10-15
你就一个用户搞很难,以前有游戏外挂就很好搞,转发给用户来弄,用户在的时候可以开启接受辨识,靠这个攒积分啥的……
-guestagain(guest again) 2021-10-14
呵呵,Kijiji说:你个小用户,还想跟咱大平台来玩这个?只要盯上你,两招就把你玩趴了......
-see1see(Isee) 2021-10-14
嘻嘻,从他们开始改程序,我坚持对抗了几个月,感觉自己已经很不容易了 LOL
-ysysning(三果) 2021-10-14
Selenium4现在是Beta版本,他们需要义工帮他们改bug,你就帮大家一个忙吧,加入改selenium bug的大军。争取早日release稳定版。
-tracyd(等待明天) 2021-10-14
你掏钱给vpn,不给kijiji,也太那个了,你写个chrome extension自动post,气死kijiji,chrome extension是javascript,你的代码大部分能用,
-googlebot(bot) 2021-10-14
给kijiji的费用够买几百个VPN账号了。
-ysysning(三果) 2021-10-14
关键是用VPN还可以下载电影😂
-benii(惊坐起) 2021-10-14
下载电影不需要VPN
-ysysning(三果) 2021-10-14
你搞extension,玩死kijiji,
-googlebot(bot) 2021-10-14
这个真不行。
-ysysning(三果) 2021-10-14
chrome extension可以的,你尝试一下,
-googlebot(bot) 2021-10-14
竭澤而渔 ;)
-6ba6(ReturnSon) 2021-10-14
是这样的,当初看到多线程,十几个chrome窗口都在自动登录post的成就感和罪恶的喜悦感冲昏了我的头脑。
-ysysning(三果) 2021-10-14
哈,我几年前自动下载pluralsight上的教程也是,下的太猛然后账号被封了……
-guestagain(guest again) 2021-10-14
哈哈,类似的我也做过。
-ysysning(三果) 2021-10-14
你的作法还创造效益。我跟keysi较劲前一阵给一个贴子点了500多个赞,一分钱的效益都没有,直到老大把他的贴子删了罢休。
-mantis(虾钟钱) 2021-10-14
没用经济利益的坏事我不做。
-ysysning(三果) 2021-10-14
值得称赞👍。
-mantis(虾钟钱) 2021-10-14
本来无聊,想写个小程序,某个鬼魅ID一出现就自动回帖钉住,但是觉得如果让老大发现太羞愧了,就算了。
-ysysning(三果) 2021-10-14
小甜豆,肉联幽灵。是,看在老大的份上,就不拿肉联做实验了:)。
-mantis(虾钟钱) 2021-10-14
用chrome extension搞自动post,能把各种检测都玩死,
-googlebot(bot) 2021-10-14
不行的,早就有人写过,收费的,不好用了。
-ysysning(三果) 2021-10-14
你自己开发extension,js的,你以前代码大部分能重用,
-googlebot(bot) 2021-10-14
等我试试,好几年没编程了,手生了。(其实原先更生)
-ysysning(三果) 2021-10-14
selenium你肯定写脚本了,extension都是js脚本,
-googlebot(bot) 2021-10-14
是的,java的
-ysysning(三果) 2021-10-14
你学习一下js,extension大部分是开源的,你可以学习参考,
-googlebot(bot) 2021-10-14
搞不动了,花钱让google进热搜就行了。
-ysysning(三果) 2021-10-14
如果攻击方用了 tor 之后,基本就要靠模式识别了 -- 不过现在有了 AI 就比较容易了。
-xmlhttprequest(build5381) 2021-10-14
太复杂了,我都接不上话了 :D
-ysysning(三果) 2021-10-14
我搞过类似的项目,为了对付检查我曾经修改过chromium的原代码,在自己编译,这样他们也能发现,最后自己搞chrome extension,轻松胜出,
-googlebot(bot) 2021-10-14
lol,先赞一个。看你的文章心情愉悦。我也在写selenium,不过那是工作需要。我曾经为了练习写代码,我拿walmart网站做靶子使,结果发现网站会识别我在用自动测试工具登陆网站。
-tracyd(等待明天) 2021-10-14
是的 我估计是selenium的开发者有意植入“指纹”,以便识别,不让这个工具成为自动攻击的工具。
-ysysning(三果) 2021-10-14
是chromium下的cef有缺陷,缺少一些chrome的plugin方面功能,检查browser的plugin能发现差异
-googlebot(bot) 2021-10-14
我暂时没听说有有意植入指纹这一说。估计selenium不会管这事。你去加入selenium义工大军就会知道到底是不是了。顺便帮他们早点release一个新版本。他们各种类码工。
-tracyd(等待明天) 2021-10-14
自动测试工具特征太明显,很容易发现,
-googlebot(bot) 2021-10-14
对,我也是这么觉得的。因为我需要重复执行一样的步骤来调试code。结果几次运行下来,跳出那种需要人工挑选图片的识别方式。我后来就不再用walmart网站当练习用了。aircanada网站没把我识别出来,我可以搜几次没问题。
-tracyd(等待明天) 2021-10-14
看不懂,但是很厉害,佩服;
-binghongcha76(一只大猫) 2021-10-15