JS逆向第一课————获取百度翻译的接口
话不多说,直入主题
本次所用到的浏览器为谷歌,用到的模块为execjs和requests
进入百度翻译打开开发者工具(或者按F12)并且切换成Ajax请求,准备开始抓包
不难发现返回的数据在这个请求里
现在开始分析
1.是个POST请求,那么一定会携带Form Data
2.查看From Data里的参数
可以发现被加密的数据只有sign
分析完了之后,开始找对sign加密的js代码
点开右上角的三个点选择Search
发现找到很多js,点第一条进去一条查看
将JS代码格式化一下
在按ctrl+F搜索sign
发现找到13个sign
一个一个排查(可以选择将可疑的sign都打上断点)
这里发现From Data所含的参数大部分都在这一块所以我们在这边下个断点 再点一下翻译
发现停在了这里我们这时进入到 对sign加密的L(e)函数里,不难理解,这个函数return的参数就是
sign的参数,我们将这段JS代码复制下来,打开pycharm写进一个创建好的trans.js文件里
我们在另一个python文件中执行这段JS代码试试
这里报了一个错误说是i没有定义我们重新到L(e)这个函数里下个断点看看i是什么东西
可以发现i就是这串字符,我们将i加进去
再来运行一次试试
还是不行,报了一个错误说是n这个函数没有定义,我们再去找找函数n在哪
这不就巧了,正好在上面,我们复制进去试试
代码加载成功,sign参数就出来了,大功告成,结束
附上源码:
import requests
import execjs
def get_headers():
headers = {
'Cookie': 'BIDUPSID=14796F7A7105E8F8C29035A8AA8E73F2;BAIDUID=98036CD4FD48105765D67894EFBC2BD7:FG=1',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0',
}
return headers
def get_sign(words):
node = execjs.get()
ctx = node.compile(open('trans.js', encoding='utf-8').read())
funcname = "e('{}')".format(words)
sign = ctx.eval(funcname)
return sign
def Form_data(words):
sign = get_sign(words)
data = {
"from": "en",
"to": "zh",
"query": words,
"transtype": "realtime",
"simple_means_flag": "3",
"sign": sign,
"token": "a46e051837506f7ec10f821b72fa4a77",
"domain": "common"
}
return data
def main(words):
url = 'https://fanyi.baidu.com/v2transapi?from=en&to=zh'
proxies = {
'http': 'http://5.16.0.174:8080'
}
headers = get_headers()
data = Form_data(words)
response = requests.post(url=url, data=data, proxies=proxies, headers=headers).json()
print(response['trans_result']['data'][0]['dst'])
if __name__ == '__main__':
main('cat')