2007年6月
python md5用于判重
1 # -*- coding: gbk -*- 2 #!/usr/bin/env python 3 from sets import Set 4 import os 5 import md5 6 class CAvoidSame: 7 def __init__(self,md5fname): 8 self.md5fname = md5fname; 9 self.md5set = Set() 10 if os.path.exists( self.md5fname ) == False: 11 fMD5=open(self.md5fname,"w+" 12 fMD5.close() 13 return 14 else: 15 fMD5=open(self.md5fname,"r+" 16 while True: 17 md5data = fMD5.read(16) 18 md5datalen = len(md5data) 19 if md5datalen == 16: 20 self.md5set.add(md5data) 21 continue 22 if md5datalen == 0: 23 fMD5.close() 24 break 25 nToFill = 16 - md5datalen 26 while nToFill > 0: 27 md5data+="0" 28 fMD5.write("0" 29 nToFill-=1 30 self.md5set.add(md5data) 31 fMD5.close() 32 break 33 def IsInAddIfNot(self,aStr): 34 m = md5.new(aStr) 35 bIsIn = m.digest() in self.md5set 36 if bIsIn == False: 37 fMD5 = open(self.md5fname,"a" 38 fMD5.write(m.digest()) 39 fMD5.close() 40 self.md5set.add(m.digest()) 41 return bIsIn 42 43 44 if __name__ == "__main__":
45 avoidSame = CAvoidSame("test.md5" 46 print avoidSame.IsInAddIfNot("aaa" 47 print avoidSame.IsInAddIfNot("bbb" 48 print avoidSame.IsInAddIfNot("ccc" 49 print avoidSame.IsInAddIfNot("aaa" 50 print avoidSame.IsInAddIfNot("bbb" 51 print avoidSame.IsInAddIfNot("ddd"
Python传递对象都是传引用的
实验如下
1 class A: 2 def __init__(self): 3 self.n =1 4 def f(a): 5 a.n = 2 6 def g(a): 7 a.n = 3 8 return a 9 a = A() 10 print a.n 11 f(a) 12 print a.n 13 b = A() 14 print b.n 15 b = g(a) 16 print b.n 17 print a.n 18 b.n =100 19 print a.n
结果
onebird@bee:~$ python test.py 12133100
酷酷酷
今天想起来,除了酷讯外 酷我,酷流,优酷 三家公司都是我差点去的。
不过好像这四家发展都不错。其实北京真的很小,我在北京接触的人基本上反复遇到。
还遇到不少同村同乡。
关于本站的不稳定性
本站的机器只有512M,使用lifetype系统。
由于lifetype程序实现有问题,导致没一个apache进程需要14M的空间。
导致内存不够发生swap。
目前通过对链接数和链接保持时间设置进行了优化,情况稍好一些。
但是还是不行
目前还可以的优化方式是:
1 使用lighttpd+php_fastcgi 或使用apache woker模式(php需要重新编译)
2 修改lifetype系统(不过据说内存消耗在模板生成上 估计不是太好改)
3 加上缓存处理
计划 先做 1 ,3
今天放风筝 放到100米高(估计)
作者: onebird
发布时间: 2007-06-11 23:18
分类: 生活
其实还有线但是不干放了因为已经越过一个小区。怕挂到路边造成交通事故。
真想到草原去放风筝啊。(不过草原好像也会绊倒马) 。
到哪儿才能放个爽呢。
走进酷讯,走进生活搜索--南开精英交流会
今天和陈华到南开做了一次活动,酷讯-Eling软件开发联盟合办的“走进酷讯,走进生活搜索--南开精英交流会。会议筹备的时间很短,但很成功,接触了南开软件,计算机,数学等等计算机技术爱好者。
======为什么去南开====================
我是公司的第一位研发工程师。早期酷讯的南开的工程师占了研发团队的1/4(现在少了,以北大的居多)。而且所有南开的RD都获得过优秀员工(当然不是所有的人都是优秀员工的~~,优秀员工还是很少的说)。由于现在南开的同事青黄不接了,所以我们觉得会学校捞一些更优秀的同学和师弟。
====接近正文====================
承办此活动是我当年担任主席的亿灵软件开发联盟这样一个社团(http://cs.nku.cn/eling 这个比赛网站还是我做的,美工不错吧)。 本届eling的小廖主席和研会孙主席格外热心,本来我们只想搞一个小规模的交流会演变成了”走进酷讯,走进生活搜索-南开精英交流会”,和南开软件,信科,数学等对计算机兴趣很高的同学做了交流
===活动======================
陈华和我两点多从北四环出发经京津塘至白堤路一路堵车终于提前半小时赶回学校。只至走到鞍山西道我才想起来路改怎么走(我大学期间真乖,除了到白堤路家乐福买方便面,和到鞍山西道赛博风荷园等攒机器就没怎么出过校门)。
先是和一些本科时候的老同学和acm的优秀成员等朋友一起吃了顿快餐(很快吃完的正餐)。
交流会在南开倒数第二悠久的主楼举行。首先是陈华介绍了一下酷讯的发展历程,之后我即兴介绍了一下酷讯的工程师文化。提问的人比较多,问题分三类:1 公司发展的问题,如公司如何包含用户隐私啊,更远的未来有什么想法啊,和分类信息网站的关系啊 2 技术问题 这么多网站怎么抓啊,抓全度和实时性能否都保证啊,抽取有什么办法效率如何啊,怎么保证安全性啊 3 实习和招聘的问题,招聘有何要求啊,有无培训啊,工程经验少行不行啊。
总体感觉在南开校园IT相关专业的同学对酷讯还是有预先的了解。对google生活搜索,麦田的一些评论文章也都熟悉。活动进行了两个小时,最后和大家一一告别怀这饥饿的肚子回到了北京。
希望酷讯能汇集来一些南开更优秀的同学。
====其它=====================
1 活动DM
2 活动PP
3 南开PP
4 酷讯PP
5 招聘目标
掌握检索系统及Lucene评析(1)
---
[转载]酷讯与Google生活搜索及其他垂直搜索网站或分类信息网站的比较 by leeleft
作者: onebird
发布时间: 2007-05-31 23:18
分类: 互联网
招聘技术类实习生
---
与google竞争
作者: onebird
发布时间: 2007-05-19 21:43
分类: 工作
Google.cn 发布了生活搜索。定位与酷讯完全一致,从很大程度可说是模仿酷讯。其实这是个好事情,为什么就不多解释了。
我想说的就是今后要和同事更加努力,以最接近事情本质的方式去改进产品。虽然目前google的产品质量比我们还差很远 ,但是我们要有足够的危机感平静努力有创意的去工作。
以后我会定期发布一些http://google.cn/shenghuo的质量对比报告,有兴趣的朋友请给我提意见。
其它不说了:
有敢于和google团队竞争,保持领先有信心的朋友请加入酷讯!联系人onebird at gmail.com