java读取网页内容

最新推荐文章于 2024-01-28 19:15:48 发布

原创最新推荐文章于 2024-01-28 19:15:48 发布 · 1.4k 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

收录于

java

当前文章被收录于：

java

18 篇文章 0 人学习

订阅专栏查看详情

当前文章被以下社区和专栏收录：

本文展示了一个使用Java从指定URL抓取网页内容的示例。通过创建URL对象并使用HttpURLConnection进行连接，随后利用BufferedReader读取网页的GBK编码内容，并将其打印出来。此示例适用于初学者了解如何用Java进行基本的网络爬虫开发。

public static void main(String[] args) {
        // TODO Auto-generated method stub
        String CurrentLine="";
        String TotalString="";
        InputStream urlStream;
        try {
            URL url = new URL("http://www.163.com");
            HttpURLConnection connection = (HttpURLConnection)url.openConnection();
            connection.connect();
            urlStream = connection.getInputStream();
            BufferedReader reader = new BufferedReader(
            new InputStreamReader(urlStream,"gbk"));
            while ((CurrentLine = reader.readLine()) != null) {
            TotalString += CurrentLine+" ";
                 }
            String content =  TotalString;
            System.out.println(content);
        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }

标签

#java #string #null #url