博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
java 抓取网站内容 异常code: 403
阅读量:5878 次
发布时间:2019-06-19

本文共 225 字,大约阅读时间需要 1 分钟。

hot3.png

HTTP 403命令是禁止恶意访问此网站,不能从此网站中抓取内容。如果是服务器端禁止抓取,那么这个你可以通过设置User-Agent来欺骗服务器:

connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");

转载于:https://my.oschina.net/u/2317118/blog/666609

你可能感兴趣的文章
FreeBSD添加IP设置DNS和ubantu设置IP
查看>>
OCF开发者指南 第一章
查看>>
更改当前输入法
查看>>
Foxmail通讯簿到Outlook中
查看>>
Hibernate查询技术(3)
查看>>
Hamburgers 假定解是否可行
查看>>
Java多线程设计模式(2)生产者与消费者模式
查看>>
基于whoosh的flask全文搜索插件flask-msearch
查看>>
对象并不一定都是在堆上分配内存的
查看>>
刘宇凡:罗永浩的锤子情怀只能拿去喂狗
查看>>
PHP学习笔记 第十讲 MYSQL在PHP5中的应用
查看>>
php晚了8小时 PHP5中的时间相差8小时的解决办法
查看>>
JS(JavaScript)的初了解7(更新中···)
查看>>
svn文件管理器的使用
查看>>
Ansible playbook 使用
查看>>
for/foreach/linq执行效率测试
查看>>
js /jquery停止事件冒泡和阻止浏览器默认事件
查看>>
杭电1698--Just a Hook(线段树, 区间更新)
查看>>
SVN被锁定解决办法
查看>>
我的博客园定制样式
查看>>