Java爬虫.HttpClient-白红宇

Java爬虫.HttpClient

阅读量：317 次

发布时间：2019-03-04

本文共 621 字，大约阅读时间需要 2 分钟。

1.HttpClient

网络爬虫就是用程序帮助我们访问网络上的资源。我们一直以来都是使用HTTP协议访问互联网的网页，网络爬虫需要编写程序，在这里使用相同的HTTP协议访问网页。

这里我们使用Java的HTTP协议客户端HttpClient这个技术，来实现抓取网页数据。

1.1 GET请求

访问csdn官网，请求url地址

https://www.csdn.net/

见

1.2 带参数的Get请求

在慕课网中搜索学习视频，地址为：

https://www.icourse163.org/search.htm?search=java#/

见

Ctrl+N 查找类

1.3 POST请求

使用POST请求访问CSDN官网

*仅一处变动：

创建HttpPost对象，设置url访问地址

HttpPost httpPost = new HttpPost(uriBuilder.build());

见

1.4 POST含参请求

在慕课网中使用POST含参请求搜索学习视频，地址为：

https://www.icourse163.org/search

url地址没有参数，参数search=java放在表单中进行提交

见

1.5 连接池

如果每次请求都要创建 HttpClient ，会有频繁创建和销毁的问题，可以使用连接池来解决。

见

1.6 请求参数

有时候因为网络，或者目标服务器的原因，请求需要更长的时间才能完成，我们需要自定义相关时间

见

转载地址：http://yqhq.baihongyu.com/

你可能感兴趣的文章

Javascript之旅——第九站：吐槽function

查看>>

Javascript之旅——第十一站：原型也不好理解？

查看>>

Sql Server之旅——第十站看看DML操作对索引的影响

查看>>

双十一来了，别让你的mongodb宕机了

查看>>

asp.net mvc 之旅 —— 第六站 ActionFilter的应用及源码分析

深入探索Android热修复技术原理读书笔记 —— 热修复技术介绍

查看>>

百度前端技术学院task16源代码

查看>>

解析js中( ( ) { } ( ) )的含义

查看>>

js设计模式总结5

查看>>

Python大神编程常用4大工具,你用过几个?

查看>>

一文带你了解图神经网络

查看>>

9个常用ES6特性归纳(一般用这些就够了)

查看>>

3D渲染集群，你了解多少？

查看>>

华为云FusionInsight湖仓一体解决方案的前世今生

查看>>

C++调用Go方法的字符串传递问题及解决方案