09/08
21
09/08
21
收藏一些常用的快捷方式
09/08
21
搜索引擎主要核心技术为:
(1)中英文分词语言处理;
(2)排序算法;
(3)网络爬虫;
(4)查询/存储技术
开发搜索引擎系统主要涉及到的具体技术为:
(1)http网络协议.
(2)多线程技术.
(3)socket通信.
(4)高效服务端程序开发.
(1)中英文分词语言处理;
(2)排序算法;
(3)网络爬虫;
(4)查询/存储技术
开发搜索引擎系统主要涉及到的具体技术为:
(1)http网络协议.
(2)多线程技术.
(3)socket通信.
(4)高效服务端程序开发.
09/08
19
批量转换文件的编码
for i in `find ./ -name *.htm` ; do echo $i;iconv -f gb18030 -t utf8 $i -o /tmp/iconv.tmp;mv /tmp/iconv.tmp $i; done
find -name “*.htm“ \
-exec iconv -f gb2312 -t utf8 ‘{}‘ -o /tmp/iconv.tmp \; \
-exec mv /tmp/iconv.tmp ‘{}‘ \;
-exec iconv -f gb2312 -t utf8 ‘{}‘ -o /tmp/iconv.tmp \; \
-exec mv /tmp/iconv.tmp ‘{}‘ \;
09/08
19
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。
grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。
grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。
grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。
grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。
09/08
18
几个实用的例子。。。收录一下。
09/08
13
http://tools.pingdom.com/fpt/
这个网站不但可以测试网站速度,并且可以清晰告诉我们每一个网页上的文件的下载时间。从而为我们优化页面提供依据,特别是js css等页面布局和载入文件和图片文件。
http://internetsupervision.com/scripts/urlcheck/check.aspx
这个网站可以模拟世界主要网络节点来测是你的网页速度。城市有:华盛顿(美国大西洋一带)、圣迭戈(美国太平洋沿岸)、多特蒙德(德国)、圣彼得堡(俄罗斯)、悉尼(澳洲)等等。可惜中国只有北京一个城市,应该再找一个广州或者深圳,从而我们可以清晰的看到网通和电信的距离到底有多远。
http://webwait.com
这个网站以模拟抓取的形式来测试网站的打开速度。是个总体的感觉。
http://www.just-ping.com
显示各国家ping的结果
这个网站不但可以测试网站速度,并且可以清晰告诉我们每一个网页上的文件的下载时间。从而为我们优化页面提供依据,特别是js css等页面布局和载入文件和图片文件。
http://internetsupervision.com/scripts/urlcheck/check.aspx
这个网站可以模拟世界主要网络节点来测是你的网页速度。城市有:华盛顿(美国大西洋一带)、圣迭戈(美国太平洋沿岸)、多特蒙德(德国)、圣彼得堡(俄罗斯)、悉尼(澳洲)等等。可惜中国只有北京一个城市,应该再找一个广州或者深圳,从而我们可以清晰的看到网通和电信的距离到底有多远。
http://webwait.com
这个网站以模拟抓取的形式来测试网站的打开速度。是个总体的感觉。
http://www.just-ping.com
显示各国家ping的结果
09/08
12
关于server.xml中“Host”这个元素,只有在你设置虚拟主机的才需要修改。虚拟主机是一种在一个web服务器上服务多个域名的机制,对每个域名而言,都好象独享了整个主机。实际上,大多数的小型商务网站都是采用虚拟主机实现的,这主要是因为虚拟主机能直接连接到Internet并提供相应的带宽,以保障合理的访问响应速度,另外虚拟主机还能提供一个稳定的固定IP。
基于名字的虚拟主机可以被建立在任何web服务器上,建立的方法就是通过在域名服务器(DNS)上建立IP地址的别名,并且告诉web服务器把去往不同域名的请求分发到相应的网页目录。在Tomcat中使用虚拟主机,需要设置DNS或主机数据。在server.xml中设置内容,如下....
基于名字的虚拟主机可以被建立在任何web服务器上,建立的方法就是通过在域名服务器(DNS)上建立IP地址的别名,并且告诉web服务器把去往不同域名的请求分发到相应的网页目录。在Tomcat中使用虚拟主机,需要设置DNS或主机数据。在server.xml中设置内容,如下....






