All articles| All Pictures| All Softwares| All Video| Go home page| Write articles| Upload pictures

Reading number is top 10 articles
去除正文中的html标记,但是又想保留其中的<br>_[Asp.Net教程]
序列化和反序列化XML应用程序设置类_[Asp.Net教程]
Weblogic,Portal中实现AJAX编程之架构_[Asp.Net教程]
javascript网页特效:闪现的礼花背景_JavaScript技术_编程技术
基于PHP的AJAX技术实现文件异步上传_php资料_编程技术
c#中GDI+图形图像:用直线和曲线消除锯齿
asp.net,页面事件:顺序与回传_[Asp.Net教程]
Silverlight,2(beta1)数据操作(2)——使用ASP.NET,Web,Service_[Asp.Net教程]
Session丢失原因与解决方案小结_php资料_编程技术
ASP.NET,2.0,中的,Windows,身份验证_.net资料_编程技术
Reading number is top 10 pictures
Startling Russian girl blind date scene2
Sora aoi in China1
运动的范冰冰3
这还能睡得着?
Terrorist smile the largest human history an explosion1
A man's favorite things14
Discharge accidentally Actresses by the breast1
The goddess of the single reason2
The money of more than 100 countries and regions22
The world's top ten most beautiful railway station1
Download software ranking
VC++6.0培训教程
株洲本地在线棋牌游戏
matrix1
电车之狼R
Unix video tutorial18
Popkart Cracked versions Mobile phone games
Tram sex maniac 2 (H) rar bag4
Boxer vs Yellow5
C#与.NET技术平台实战演练
Be there or be square
aaa published in(发表于) 2013/12/24 5:58:30 Edit(编辑)
用PHP程序为自己网站打造一个搜索引擎_php资料_编程技术

用PHP程序为自己网站打造一个搜索引擎_php资料_编程技术

用PHP程序为自己网站打造一个搜索引擎_php资料_编程技术-你的首页-uuhomepage.com

一,设计搜索表单

在网站的根目录下建个search.htm,内容如下






























二,搜索程序

再在根目录下建个search.php 的文件,用来处理search.htm表单传过来的数据.内容如下

//获取搜索关键字
$keyword=trim($_POST[“keyword”]);
//检查是否为空
if($keyword==””){
echo”您要搜索的关键字不能为空”;
exit;//结束程序
}
?>

这样如果访问者输入的关键字为空时,可以做出提示。下面是遍历所有文件。

我们可以用递归的方法遍历所有的文件,可以用函数opendir,readdir,也可以用PHP Directory的类。我们现在用前者.

//遍历所有文件的函数
function listFiles($dir){
$handle=opendir($dir);
while(false!==($file=readdir($handle))){
if($file!="."&&$file!=".."){
//如果是目录就继续搜索
if(is_dir("$dir/$file")){
listFiles("$dir/$file");
}
else{
//在这里进行处理
}
}
}
}
?>

在红字的地方我们可以对搜索到的文件进行读取,处理.下面就是读取文件内容,并检查内容中是否含有关键字$keyword,如果含有就把文件地址赋给一个数组。

//$dir是搜索的目录,$keyword是搜索的关键字 ,$array是存放的数组
function listFiles($dir,$keyword,&$array){
$handle=opendir($dir);
while(false!==($file=readdir($handle))){
if($file!="."&&$file!=".."){
if(is_dir("$dir/$file")){
listFiles("$dir/$file",$keyword,$array);
}
else{
//读取文件内容
$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file"));
//不搜索自身
if($file!=”search.php”){
//是否匹配
if(eregi("$keyword",$data)){
$array[]="$dir/$file";
}
}
}
}
}
}
//定义数组$array
$array=array();
//执行函数
listFiles(".","php",$array);
//打印搜索结果
foreach($array as $value){
echo "$value"."
";
}
?>

现在把这个结果和开头的一段程序结合起来,输入一个关键字,然后就会发现你的网站中的相关结果都被搜索出来了。我们现在在把它完善一下。

1,列出内容的标题


if(eregi("$keyword",$data)){
$array[]="$dir/$file";
}

改成

if(eregi("$keyword",$data)){
if(eregi("",$data,$m)){
$title=$m["1"];
}
else{
$title="没有标题";
}
$array[]="$dir/$file $title";
}

原理就是,如果在文件内容中找到,那么就把xxx取出来作为标题,如果找不到那么就把标题命名未”没有标题”.

2,只搜索网页的内容的主题部分。

做网页时一定会有很多html代码在里面,而这些都不是我们想要搜索的,所以要去除它们。我现在用正则表达式和strip_tags的配合,并不能把所有的都去掉。


$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file"));
//不搜索自身
if($file!=”search.php”){
//是否匹配
if(eregi("$keyword",$data)){

改为

$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file"));
if(eregi("]+)>(.+)",$data,$b)){
$body=strip_tags($b["2"]);
}
else{
$body=strip_tags($data);
}
if($file!="search.php"){
if(eregi("$keyword",$body)){

3,标题上加链接

foreach($array as $value){
echo "$value"."
";
}

改成

foreach($array as $value){
//拆开
list($filedir,$title)=split(“[ ]”,$value,”2”);
//输出
echo "$value"."
";
}

4防止超时

如果文件比较多,那么防止PHP执行时间超时是必要的。可以在文件头加上

set_time_limit(“600”);

以秒为单位,所以上面是设10分钟为限。

所以完整的程序就是

set_time_limit("600");
//获取搜索关键字
$keyword=trim($_POST["keyword"]);
//检查是否为空
if($keyword==""){
echo"您要搜索的关键字不能为空";
exit;//结束程序
}
function listFiles($dir,$keyword,&$array){
$handle=opendir($dir);
while(false!==($file=readdir($handle))){
if($file!="."&&$file!=".."){
if(is_dir("$dir/$file")){
listFiles("$dir/$file",$keyword,$array);
}
else{
$data=fread(fopen("$dir/$file","r"),filesize("$dir/$file"));
if(eregi("]+)>(.+)",$data,$b)){
$body=strip_tags($b["2"]);
}
else{
$body=strip_tags($data);
}
if($file!="search.php"){
if(eregi("$keyword",$body)){
if(eregi("",$data,$m)){
$title=$m["1"];
}
else{
$title="没有标题";
}
$array[]="$dir/$file $title";
}
}
}
}
}
}
$array=array();
listFiles(".","$keyword",$array);
foreach($array as $value){
//拆开
list($filedir,$title)=split("[ ]",$value,"2");
//输出
echo "$title "."
";
}
?>

到此为止,你已经做好了自己的一个搜索引擎,你也可以通过修改内容处理部分来改进它,可以实现搜索标题,或者搜索内容的功能。也可以考虑分页。这些都留给你自己吧。

这里说明一下用preg_match代替eregi,会快很多。这里只是为了通俗易懂,所以使用了常用的eregi.





添加到del.icio.us 添加到新浪ViVi 添加到百度搜藏 添加到POCO网摘 添加到天天网摘365Key 添加到和讯网摘 添加到天极网摘 添加到黑米书签 添加到QQ书签 添加到雅虎收藏 添加到奇客发现 diigo it 添加到饭否 添加到飞豆订阅 添加到抓虾收藏 添加到鲜果订阅 digg it 貼到funP 添加到有道阅读 Live Favorites 添加到Newsvine 打印本页 用Email发送本页 在Facebook上分享


Disclaimer Privacy Policy About us Site Map

If you have any requirements, please contact webmaster。(如果有什么要求,请联系站长)
Copyright ©2011-
uuhomepage.com, Inc. All rights reserved.