JAVA抓取一个HTML源代码_JAVA_编程开发_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 编程开发 > JAVA > JAVA抓取一个HTML源代码

JAVA抓取一个HTML源代码

 2011/7/11 11:07:49  stevenjohn  http://stevenjohn.iteye.com  我要评论(0)
  • 摘要:packagecom.hyq.src;importjava.io.InputStream;importjava.net.URL;publicclassTest{/***@paramargs*/publicstaticvoidmain(String[]args){try{Test.testNetStream();}catch(Exceptione){e.printStackTrace();}}publicstaticvoidtestNetStream()throwsException
  • 标签:Java 一个 代码


package com.hyq.src;

import java.io.InputStream;
import java.net.URL;


public class Test {
	
	/**
	 * @param args
	 */
	public static void main(String[] args) {
		try{
			Test.testNetStream();
		}catch(Exception e){
			e.printStackTrace();
		}
	} 
	public static void testNetStream()throws Exception{
		URL url=new URL("http://www.imust.cn/");
		InputStream in=url.openStream();
		byte[] b=new byte[100000];
		in.read(b);
		in.close();
		String s=new String(b);
		System.out.println(s);
	}
}













package com.hyq.src;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;



public class Test {
	
	public static void main(String[] args)
	{
		System.out.println(Test.getHtmlSource("http://sports.163.com/zc/"));
	}
	
	public static String getHtmlSource(String url){
		StringBuffer stb=new StringBuffer();
		try{
			URLConnection uc=new URL(url).openConnection();
			BufferedReader br=new BufferedReader(new InputStreamReader(uc.getInputStream(),"gb2312"));
			String temp=null;
			while((temp=br.readLine())!=null){
				stb.append(temp).append("\n");
			}
			br.close();
			
		}catch(Exception e){
			e.printStackTrace();
		}
		return stb.toString();
		
	}

	
}



发表评论
用户名: 匿名