注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

..、、的博客

..、、

 
 
 

日志

 
 

java抓取网址中指定内容  

2013-04-16 11:07:19|  分类: java |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;

public class Test {

 /**
  * @param args
  */
 public static void main(String[] args) throws Exception{
  // TODO Auto-generated method stub
  System.out.println(getURLContent());
 }
 
 private static String getURLContent() {
  StringBuffer sb =new StringBuffer();
        try {
   URL urlmy =new URL("http://jinshan7022.vip.blog.163.com/blog/static/11758692020133159917126/?touping"); //要抓取的网址
   HttpURLConnection con = (HttpURLConnection) urlmy.openConnection();
   HttpURLConnection.setFollowRedirects(true);
   con.setInstanceFollowRedirects(false);
   con.connect();
   BufferedReader br =new BufferedReader(new InputStreamReader(con.getInputStream(),"GBK"));
   String s ="";
   while((s = br.readLine()) !=null) {
       sb.append(s+"\r\n");
   }
   
  } catch (Exception e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }
  String start = "自从20多"; //抓取内容开始
  String end ="严峻的课题";//抓取内容结束

  int a = sb.indexOf(start);
  int b = sb.indexOf(end);
  return sb.substring(a, b) + end ;
    }
 
}

  评论这张
 
阅读(142)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017