2007-03-04 Sun
Bob Beck (beck@) recently committed some interesting changes with much help from reyk@. Namely, database synchronizaton for spamd & spamlogd.
Read more...今天,谷歌图书搜索中文试用版上线了。Google 图书搜索语言种类因此增加到8个,这也是谷歌图书搜索在中国的开始。
这是一款提供全文检索的图书搜索产品,中文用户即使在不明确目标书籍是哪本的情况下,也可以通过输入某些“关键词”,找到和这些“关键词”匹配的图书并购买。
在传统的图书馆式书籍内容登记与查询方式中,图书管理员通过对书的内容进行摘要登记,然后把这摘要输入成为电脑可识别的数据,因此可被搜索的“图书”其实只是人工作出的摘要部分;谷歌图书搜索与此最大的不同之处是,它对收录的全书每一内容页进行扫描,并通过 OCR 技术 把扫描的图像转换成可搜索的文字内容。这个数字化转换过程,使尘封的经典书籍不再因为时间、地理限制而堆积在难以找寻的物理库存中。读者们将可以看到字字句句印在书中的原貌,出版商们的所有书目也因此拥有了一个永不下架的展示厅。
目前谷歌全球的多语言图书搜索已包括共一百多万本书籍。在中国,这个任务才刚刚开始, 我们还有很长的路要走。在今天的图书搜索中文试用版中,人们能看到的书籍数量还比较有限,有不少书还在被紧张扫描中。目前古典国学类的书籍收录相对丰富一些;而中文现代书籍的收录,则还要期待更多出版商的参与。
示例1 - 现代中文全文图书搜索:
例如我们想考察一下有哪些书中提到过“搜索引擎”的发展,输入“搜索引擎”后,第一个结果就可以把我们带到:清华大学出版社出版的《因特网信息资源检索与利用》。你可以象在书店中买书那样前后翻上几页,以便决定这本书是不是真正所需,而不是看着简单的几句摘要或目录作艰难揣测。
此外, 我们还可以通过页面右侧方便的链接,到拥有这本书的网上书店购买, 或者通过 “查找本地书店”功能,到谷歌地图中去寻找您当地最近的书店。与地图的整合,给图书搜索带来更广阔的想象空间 - 如果这搜索在未来能够直接与各书店相关的库存信息直接接轨,就意味着我们可以智能地知道,在距我们最近的哪家书店能最快购买到自己心仪的书籍,是不是很方便呢?
示例2 - 国学图书搜索:
想看看"老吾老以及人之老 幼吾幼以及人之幼"这句话的上下文?输入它后,选择在“国学图书”内搜索,第一个结果把我们带到了《孟子集注》的第20页,原来孟子说的是,"老吾老,以及人之老,幼吾幼,以及人之幼,天下可运于掌",向大家劝说“推恩足以保四海”的道理呢。这些来自中国五千年悠久历史与文化的积累,正可以通过Google这个面向全球的信息平台,展现给全世界更多的人。
一旦找到了喜欢的图书,可以做点什么?
• 浏览:点击前向箭头,浏览可查看的书页,了解该书是否对您有用或是否能够引起您的兴趣。
• 在此书中搜索:点击旁边的其他搜索结果,查看带有原始搜索字词的其他书页,或者在此书中尝试新的搜索。
• 购买此书:点击指向在线书商的链接之一,直接进入可以购买此书的网页。
• 查找评论:选择"关于此书",然后点击"在网上搜索评论"来查找该书的在线评论。
• 在图书馆中查找:许多图书有图书馆链接。查找"在图书馆中查找此图书"链接,以找到藏有图书副本的当地图书馆。
• 了解出版商:点击出版商徽标进入其网站以查找来自该出版商的更多图书。
谷歌图书搜索期望着能带给爱书的人又一个全新的探索与浏览空间,并帮助中国的出版社伙伴,让历史上曾出版过的优秀中文书籍超越时空的限制,走向互联网 - 这个永不落幕的世界书市。
2007-03-03 Sat
今天,Google(谷歌)在机器翻译工具上增添了一个新特性,叫做翻译反馈。这项功能面向广大用户,通过 Google(谷歌)平台,整合网民的智慧,完善 Google 的翻译质量。
具体来说,如果用户在使用 Google 的翻译工具时,一旦发现 Google 翻译网页的结果不尽完善,便可以向 Google 提交更好的翻译。操作方法非常简单:在翻译结果页面,当您把鼠标停在需要改进的翻译字句、段落上时会出现一个包含的原文的迷你窗口,点击窗口内的"提交一 个更好的翻译",就ok了。
虽然用户提交的翻译反馈不会直接出现在Google的翻译结果中,但经过综合分析,会在 Google 下一轮的系统更新中对改进我们的翻译质量大有帮助。
网页翻译反馈的新特性目前只能用在 Google 机器翻译团队研发的 3 对语言之间。除了中/英互译外,还包括英语/阿拉伯语互译和英/俄互译,另外,简繁体转换也实现了这个新功能。
看到不满意的翻译,不要再皱眉头啦,让我们把聪明才智累加并分享给大家吧!
Last year, we released the first public beta of gtags, a tool used at Google to improve developer productivity.
Gtags, an extension of the GNU Emacs TAGS functionality, consists of a server that stores an index of a project's source code in memory, and client libraries that allow applications (such as Emacs, Vim or shell scripts) to perform fast queries for function names, class names and other language features. Gtags can currently index code written in C++, Java and Python.
This release improves the infrastructure, replaces the network protocol and introduces a new, more extensible file format for storing the index.
Additionally, we are now hosting the project on Google Code. Please visit us at the new gtags project page.
Enjoy!
他这一段,写的主要是八路军和地方部队配合作战的内容,其中就提到了地雷战。有这样一段描写 –
“需要说明的是,那些以为地雷炸死不少老百姓的说法,多半是受了电影电视的误导,其实,抗战时的民兵地雷,原本没有多大杀伤力,能不能炸死人都难说。
民兵使用的地雷,厉害的有两种:一种装填黄色炸药,这是兵工厂生产的,每个村只发几个,如果打了胜仗立了功也能再奖励几个,总之十分难得;另一种是特大号地雷,可这玩意不仅成本高,而且容器不好找、还不容易伪装,所以用的也不多。
最常见的是装黑火药的“铁西瓜”,实际上就是个大鞭炮,主要靠混在爆炸物里的铁片、石子伤人,崩得好能打中要害,崩得不好也就是个烧伤。因此,在 真正的地雷战里,那种“地雷一响鬼子就飞到天上”的场面其实不多,更常见的是——“轰”的一声,鬼子突然变成个黑不溜丘浑身冒青烟的灶王爷,怪叫着又蹦又 跳。“
看完最后一段形容的鬼子形象,忍俊不禁。
这段描写毫不夸张,当年我家一个老乡孙广瑞,抗战中在河北鼓捣地雷的时候,就碰到过同样的问题。
孙广瑞是和我老家一个村子的人,晋梦奇司令的战友,也是当地抗战的领导人之一,解放后在河北司法系统工作,最后职务为河北高检院长,已经有十来年没有老人 的消息了,如果他还在世,大概有九十岁了。他在七十年代来北京开会还到过我家,当时对晋梦奇的死依然很痛惜,说晋若不死,会比他的职务还高,因为晋的“文 化水平高,政策水平高”。
河北当地八路军组织抗战,也碰到和马甲提到的同样问题 – 地雷威力不够,炸不死日军。
怎么办呢?唯一的办法就是改进装药,这活儿上面就交给了孙广瑞 – 谁叫他原来是学纺织的呢,说起来这一行多少和化学有关系。这种赶鸭子上架的活计不由你推托,谁叫八路里面文化人太少呢?可是效果如何,那实在不好说。孙广 瑞是个武书生,杀敌放火,夜黑风高是他的本色,要他回到书本上搞学问那可费劲了,更要命的是威力不够指的是民兵玩的黑火药地雷,当地的鞭炮手艺人的工夫。 就算想出新的配方他们学起来也难啊 – 有几个民兵能分得清硝和苯是什么玩艺儿?
但是,孙广瑞还真是有办法,他的学问如何不知道,脑子是绝对的聪明。
于是,老孙就带着几个手下进邯郸城了,出来的时候让弟兄们先走,自己还玩了一把个人英雄主义的亮相 – 放倒哨兵,匹马出城。伪《华北日报》称孙广瑞为“匪徒”,说“匪徒鸣枪过市,一城皆惊。”
不过孙广瑞进城可不是为了亮相,出来以后他就把这次进城所获分成大小口袋,交给了各村的民兵,让他们掺到地雷的火药里面去。
从此,邯郸的鬼子苦日子就来了。
出城扫荡踩上地雷,威力依然是“鬼子突然变成个黑不溜丘浑身冒青烟的灶王爷,怪叫着又蹦又跳。”
但是,这之后事情可就不一样了,伤,是不重,但受伤的地方很快不是大面积溃烂,就是奇痒难熬,发黑坏死红线穿心不一而足,不但军医束手无策,而且伤员极为痛苦,竟有日军用刺刀给自己截肢的事情发生。
日本方面百般研究,始终弄不清八路的地雷里放了什么,敌伪方面纷纷传言八路的地雷现在是“神秘武器”,伪军称为“一粘死”。
放的什么?
其实一点儿也不神秘。
俺们河北有个传统,最富的商家,不是骡马行,不是织机场,而是大生药铺子,西门庆,卢俊义,就都是俺们老乡。孙广瑞好端端的不琢磨科学,就琢磨上了这生药铺子。
原来,此人年少的时候好读杂书,知道宋史里面有一段,说唐家(是不是西川唐家待考)给皇帝献过“毒火球”,就是古代的火药武器里面掺杂毒药的武器,于是灵 机一动,这东西现在不也一样能用么?玩起了抗日版的“霹雳堂主”。他进城,就是奔了几个大生药铺,一番工作之后,自愿不自愿的“西门庆”们都乖乖地把铺子 打开了任八爷挑选 – 反正又不是红伤药,“太君”对什么狼毒巴豆的也不管制。
于是,八路的地雷里就加了这些“佐料”,而且,这些药一旦发现有效,也不一定需要从城里买,发动群众去采,乡下的草郎中分辨几味药材可不是难事。
问题是,日本军医上哪儿知道狼毒巴豆砒霜和火药会产生怎样的化学反应,该用什么对症药呢?
当然地雷不长眼,不但是炸日本人,也炸中国人。不久,就有一个给日军作翻译的被地雷给炸了,尽管日本军医尽力诊治,依然两条腿很快就开始烂,每日哀号不已,要死要活。
这个翻译官是本地人,其家人辗转托人找到了八路敌工部,求八路老爷给“解药”,并且表示,如果治好,一定弃暗投明,暗中为八路做事,违者天诛地灭。
敌工部斟酌之后,认为是个好机会,难得能在日军心脏里面按一颗钉子,就来找孙广瑞商量。
孙广瑞听了以后,翻着眼皮想了想,说你去问问吧,他挨的雷要是八月十五以前埋的,我还有办法,要是八月十五以后埋的,那就。。。
敢情民兵被孙广瑞的创举调动了积极性,也开阔了思路,有民兵在地雷里加入了晒干的人畜粪便,结果发现效果奇好。从八月十五以后,这种东西就成了当地地雷的 标准装药。要是原来的“中药地雷”,孙广瑞还可以说出个子午卯酉,中医还有办法,加上这个东西,就是八路自己,也爱莫能助了。
一问,不幸,八月十五以后的雷。。。
敌工部只好把这条线掐了。
这翻译官不久死去。
后来听说是翻译官在伪军中的把兄弟看他太痛苦,做善事给了他一枪。
忽然想到,土八路这种“神秘武器”,要在今天,该算是“化学武器”加“生物武器”了吧?
[完]
Eric Enge of Stone Temple Consulting interviewed our own Mark Lucovsky about the AJAX Search API that Mark and his team created.
The interview provides detailed answers to questions such as:
- What we learned from the Maps API
- How the AJAX Search API came about, and why we built it
- How the API aims at a broad spectrum of users, from lifelong programmers to the casual blogger
- How the API can be used to perform searches, get back JSON results, and display them however you like
- What the terms of use actually mean
- Why the team used JSON output.
Is there anything else that you would like to know about the APIs? Join us on the AJAX Search forums.
周末了,我一时兴起登陆了在美国的股票帐户玩儿。发现里面的股票交易的下单选择有三种:Buy , Sell , 和 Sell Short 。这 Sell Short 就是传说中的卖空了,在国内的股市上还不能这么操作。我一直是有耳闻,而不得其详。
一时冲动想试一下,终于搞清楚是怎么个运作了。
所谓卖空,就是向某人借入一支你想卖掉的股票(简单说就是看跌的股票)来执行卖出操作。当然这个借股票的过程是由股票交易机构帮你完成的,并不需要直接去找个持有这支股票的人来借。
借的过程相当于定了个契约,这一步交易机构并不收你佣金。但是执行 Sell Short 这个操作,需要立刻把借来的股票卖掉,这卖掉是要收交易佣金的(所以还是被交易中介赚到了钱)。
卖掉借来的股票后,你就立刻有了一笔现金,不过同时你还欠人一笔股票。如果你的帐户里的资产够偿还这笔股票,是没有人催你还的。如果日后这支股票跌了,你可以选择把股票还掉,当然是以当时的低价买入偿还。前后有一个差价(当初 sell short 时你获得的现金和事后你用钱购入股票偿还),这就是你的赢利。反之,如果股票涨了的话,你就需要用更多的现金来购买这支股票来偿还了。
因为 Sell Short 这种操作对于交易机构来说,你至少要执行两次操作(当时的一次,和日后偿还时执行的购入操作一次),这样交易佣金也是两次。多一种操作方法,可以促进交易频率。所以对于他们来说,是鼓励客户做这种操作的。
我前几年玩过半年外汇实盘,当时做足了功课。一些技术分析工具还是用的比较熟的(个人偏好是用 Bollinger Bands 布林带)。靠技术分析,当年在外汇投资上小赚了点零花钱,对自己的操作能力还是比较有信心的。
后来觉得太费精力,又逐步失去乐趣,而没有再做。
今天重新拣回来还是满有意思。挑了些自己熟悉的国内公司,比如 SINA ,SOHU ,SNDA ,NCTY ,BIDU 等,逐个看了技术图。最后决定 Sell Short 百度 :)当时的价格是 105.4 ,最近几天一直在跌,我认为还回继续下去。小小尝试了 100 股。
结果太另人失望了,BIDU 居然是一支 Hard-to-Borrow 的股票 :( 不能操作。我的理解就是,市场上没人愿意借给我卖掉这支股票。
第二个选择就是 SINA ,Sell Short 了 500 股,居然立刻成交了。成交价是 33.35 。付了 12 块多的佣金。不过到写这篇 Blog 时,SINA 已经跌破 33 块了。:D
纯属娱乐 :) 下周工作日就不玩了。还是写程序最有意思哈。
ps. 告戒一切证卷市场上拼搏的朋友,切勿投机,少做短线。
川崎春彦 日中战争 -- 一个士兵的证言
上个星期在图书馆看到上面这本书,接着又读了这个作者的另一本书《恩仇的大陆 -- 华中战线转战谱》,其中,关于日军与新四军作战的一段史实,觉得颇值得研究。
作者川崎春彦,时任日本陆军军曹,卫生兵兵长。昭和18年(1943年)应征入伍,先后参加衡阳,桂林诸战役。1945年,他所在的医务班配属日军作战部队,和新四军所部在湖南南部展开了一系列的战斗。
其中,1945年6月,他和另外五名卫生兵参加了日军(师团参谋森中佐指挥)在郊下塘对新四军的讨伐作战。结果,三百名日军,五百名伪军组成的讨伐队,出 发仅半日就遭到大队新四军的重重包围,激战中,伪军首先溃散投降,日军在掷弹筒和机枪掩护下三次突围,第一次阵亡二十人,负伤二十人,第二次突围阵亡十 五,负伤十,第三次突围“本队已伤亡过半,负伤者和死者不得不抛弃在田野中,因为无法将他们带走,只好无可奈何地放置”。只是由于新四军叛变士兵的指导, 才冲出包围圈。
而他们突围出来以后,在山下的村庄中发现来接应的侦察部队也被消灭,其中两名俘虏被杀(作者形容新四军“不是军队,是残忍的盗匪”,但又不得不承认对新四军的战法心有余悸)。
因为愤恨侦察部队的俘虏被新四军所杀,日军遂在军医寺山的指挥下将那名叛变为日军指路的新四军士兵活体解剖。
此后,双方又有两次交锋。作者形容新四军使用的“多是明治,大正时期的落后武器”。
数日后,日军(一个不完整的联队,由师团参谋长带领)南下到达宜章郊外,八月十三日,遭到新四军大军的夜袭,千余日军被三万名新四军包围,十四日夜,日军认 识到不突围就将被歼灭,遂寻找新四军包围圈空隙,于西方乘新四军哨兵吃饭时间杀死两名哨兵,全军悄然突出,一直经过十个小时的奔逃,第二天早晨到达宜章五十公里外, 没有新四军的地区,方能第一次休息。“从三万人的大包围网中完全脱出”。
日军这支部队16日才通过无线电和友军联系,得到了战争已经结束的消息。。。
原书插图
这节文字让人很感兴趣,因为新四军抗战的文献在日文中不多,而此文更是提到了新四军“大部队”对日军千人以上部队都敢于围攻的战例,更是难得的史料。从这 次战斗看,日军伤亡不小(以郊下塘之战而言,应当是毙伤日军一百五十人以上,歼灭,迫降伪军五百人,堪称大仗,宜章之战伤亡不详),而且屡屡被新四军包 围,显然新四军有相当出色的作战计划和指挥官。
那么,这次战斗,中方资料中可有记叙?从时间和地点来看,当时活动在周围的新四军是哪支部队?有没有日军所说的三万余人,战斗的结果又是怎样纪录的呢?假如有知情的朋友,希望能提供相应的材料,无疑是对这“对日的最后一战”极好的纪念。
先谢过了。
[等待]
2007-03-02 Fri
A few nice updates to the Personalized Homepage this week for those who are feeling too lazy to customize it. If for instance you're feeling lazy about browsing for new content to add to your homepage, there's a new feature that will give you item-to-item recommendations. For my part, I have the Digg gadget on my page. If I click on the gadget's drop-down menu and select "You might also like..." I'll get a bunch of stuff that other people who like Digg also liked, including Slashdot, Wired News, Macworld, and more.
For those who are too lazy to create new tabs to organize stuff, here's a bit of magic. If you add a new tab to your homepage, you can name your tab and have the option of letting us select the content for you based on your chosen name. Say I create a tab called "Astronomy" to get the latest news and info on that topic. We'll populate the page with the NASA image of the day, the current moon phase, and a bunch of feeds related to astronomy. Less lazy folks are welcome to try to stump us with tab names.
And if you just don't know what you want, we've added ratings and reviews to our directory, so you can see what other people have to say before committing to a new gadget.
Let us know what you think. We're never too lazy to listen.
