教程集 www.jiaochengji.com
教程集 >  脚本编程  >  Asp.net  >  正文 asp采集数据并自动判断网页编码并转换

asp采集数据并自动判断网页编码并转换

发布时间:2016-09-27   编辑:jiaochengji.com
教程集为您提供asp采集数据并自动判断网页编码并转换等资源,欢迎您收藏本站,我们将为您提供最新的asp采集数据并自动判断网页编码并转换资源
在做采集的朋友就会知道经常会碰到采集过来的内容是乱码,下面我们就来看一篇关于asp采集数据并自动判断网页编码并转换吧。
<blockquote><%@LANGUAGE="JAVASCRIPT" CODEPAGE="65001"%>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>asp自动判断网页编码并转换</title>
</head>
<%Server.ScriptTimeout=9999999;
function send_request(url){
var codedtext;
http_request = Server.CreateObject("Microsoft.XMLHTTP");
http_request.Open("GET",url,false);
http_request.Send(null);
if (http_request.ReadyState == 4){
//自动判断编码开始
var charresult = http_request.ResponseText.match(/CharSet=(S )">/i);
if (charresult != null){
var Cset = charresult[1];
}else{Cset = "gb2312"}//对获取不到的网站采用gb2312编码,可自行更改
//自动判断编码结束
codedtext = bytesToBSTR(http_request.Responsebody,Cset);
}else{
codedtext = "Erro";
}
return(codedtext);
}
function bytesToBSTR(body,Cset){
var objstream;
objstream = Server.CreateObject("Adodb.Stream");
objstream.Type = 1;
objstream.Mode = 3;
objstream.Open();
objstream.Write(body);
objstream.Position = 0;
objstream.Type = 2;
objstream.Charset = Cset;
bytesToBSTR = objstream.Readtext;
objstream.Close;
return(bytesToBSTR);
}%>
<body>
<%Response.Write(send_request("http://www.jiaochengji.com/404.htm"))%>
</body>
</html> </blockquote>

采集原理很简单就是用了asp xmlhttp来采集,并且adodb.stream来对采集过来的数据进行处理。

您可能感兴趣的文章:
asp采集数据并自动判断网页编码并转换
从ASP迁移至ASP --最初的考虑(一)
PHP 数组字符集编码转换的函数
搜索引擎的难点及工作原理
php自动识别字符集并转换的实例详解
php asp jsp的区别
php判断字符编码的二个方法
php自动识别文字编码并转换
php,jsp,asp的区别是什么?
解决PHP中文乱码的4项小技巧

[关闭]
~ ~