学习资源库网站 所有下载连接

  • V2_147336
    了解作者
  • 261.8KB
    文件大小
  • rar
    文件格式
  • 0
    收藏次数
  • VIP专享
    资源类型
  • 0
    下载次数
  • 2022-06-02 11:26
    上传日期
学习资源库网站 由于迅雷离线空间的庞大 然而学习资源库网站)所有下载连接不能使 所有本人特地写了这个Java爬虫来获取下载页的所有下载连接 只需修改网页地址
com.xiexi111.rar
内容介绍
package com.xiexi111.webRobot; import java.io.IOException; import java.net.MalformedURLException; import java.net.URL; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class TestRobot { public static void main(String[] args) { String URL = "http://www.xuexi111.com/jiaocheng/shipin/26275.html";//下载页的网址:如:http://www.xuexi111.com/jiaocheng/shipin/26275.html try { Document document = Jsoup.parse(new URL(URL),4000); Element tableElement = document.getElementById("download-table"); //System.out.println(tableElement.html()); Elements downloadLinks = tableElement.select("a[href]"); int count=0; for (Element downloadLink : downloadLinks) { count++; if(count%2!=0){ System.out.println(downloadLink.attr("href")); } } } catch (MalformedURLException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
评论
    相关推荐
    • 爬虫javaDemo
      爬虫demo,直接使用,可实现各种网站内容的爬取,易于镶入已有项目,简单实用
    • 网络爬虫java
      网络爬虫,用java简单实现,能实现对一个网站的信息抓取,只需要修改一下正则表达式就行。
    • 网络爬虫java
      网络爬虫java
    • 网络爬虫JAVA扩展包
      网络爬虫JAVA扩展包,有commons-httpclient-3.1.jar, htmllexer.jar, htmlparser.jar, 试用了,可以正常用
    • 网络爬虫JAVA
      网络爬虫JAVA 网络爬虫JAVA
    • 网络爬虫 java
      java版本的网络爬虫,主要爬门户网站的新闻。代码导入ecplise就能用。抓取新闻,分析新闻,入库全部实现。内附数据库脚本。
    • 简单网络爬虫Java代码(借鉴)
      一个简单的网络爬虫代码,附带所需jar包,初学者可以借鉴
    • 京东苏宁爬虫java源码
      自己写的京东 苏宁 商品Java爬虫 用jsoup httpClient
    • 网络爬虫 Java
      网络爬虫源码,直接部署到MyEclipse下就可运行,只能爬搜狐网站
    • 网络爬虫 Java Websphinx
      Java编写的一个网络爬虫的程序,有相当参考价值