Ubuntu10.4明天就要发布了。俺的光驱虽然坏了,但是难掩跃跃欲试的激动。
于是在第一时间找到了支持在Windows下建立Ubuntu10.4自启动U盘方法。
UNetbootin:自启动U盘制作工具。网址http://unetbootin.sourceforge.net/
PS.这个Blog有更多关于Ubuntu U盘的信息,居家旅行,休闲必备。
Ubuntu10.4明天就要发布了。俺的光驱虽然坏了,但是难掩跃跃欲试的激动。
于是在第一时间找到了支持在Windows下建立Ubuntu10.4自启动U盘方法。
UNetbootin:自启动U盘制作工具。网址http://unetbootin.sourceforge.net/
PS.这个Blog有更多关于Ubuntu U盘的信息,居家旅行,休闲必备。
字码 | 解决乱码 | 多个操作系统 | 图形用户界面 | |
---|---|---|---|---|
默认 | GBK | × | × | ○ |
win32mbcs | GBK | ○ | × | ○ |
hg-fixutf8 | 使用UTF – 8 | ○ | ○ | ○ |
Cygwin | 使用UTF – 8 | ○ | ○ | × |
[extensions] fixutf8 = C:Program FilesTortoiseHghg-fixutf8fixutf8.py
ok,乱码问题应该已经解决了。
HTML4,Html5,XHtml1,XHtml1.1,XHtml2….都是W3C的产品,乱乱的一团糟。有一篇漫画《标记语言之乱 ”xhtml2″vs“xhtml1”vs“html5”》,澄清了之间的关系。基本上是将XHtml2已死,天下是Html5和XHtml1的。
微格式是让网页通过语意相关让内容人机可读的一种方式。Wordpress里内置的XFN就可以算作一种微格式。那么什么是微数据呢?
HTML5提供了一种简易的方式将语义标签融入其中,这项功能就是微数据(Microdata)。根据W3c三月份的会议,微数据的存在就是为了填补微格式在应对类似Rdfa这种比较复杂的系统时的不足。
示例(Html5未完成,不保证和最终版本一致):
<section itemscope itemtype="http://example.org/animals#cat"> <h1 itemprop="name http://example.com/fn">Hedral</h1> <p itemprop="desc">Hedral is a male american domestic shorthair, with a fluffy <span itemprop="http://example.com/color">black</span> fur with <span itemprop="http://example.com/color">white</span> paws and belly.</p> <img itemprop="img" src="hedral.jpeg" alt="" title="Hedral, age 18 months"> </section>
从上面这一段HTML可以得到如下信息:有一只猫,他:
Property | Value |
name | Hedral |
http://example.com/fn | Hedral |
desc | Hedral is a male american domestic shorthair, with a fluffy black fur with white paws and belly. |
http://example.com/color | black |
http://example.com/color | white |
img | …/hedral.jpeg |
你可以使用微格式的Dom模型来访问它:
var cats = document.getItems("http://example.com/feline");
var colors = cat.properties['http://example.com/color'].values;
var result;
if (colors.length == 0) {
result = 'Color unknown.';
} else if (colors.length == 1) {
result = 'Color: ' + colors[0];
} else {
result = 'Colors:';
for (var i = 0; i < colors.length; i += 1)
result += ' ' + colors[i];
}
是不是很神奇?
你可以将使用itemtype=”http://microformats.org/profile/hcard”来描述名片信息,也可以用http://microformats.org /profile/hcalenda来描述日历。这样就不用另立标准,使用微格式的标准就可以了。
再谈谈RDFa。RDFa是一个W3C 推荐标准。它扩充了XHTML的几个属性, 网页制作者可以利用这些属性在网页中添加机械可读的元 数据。与RDF数据模型的对应关系使得 RDFa可以将RDF三体嵌入在XHTML文件中,它也使得符合标准的使用端可以从RDFa文件中萃取出这些RDF三体来。推荐一篇学习RDFa的文章, 《RDFa 入门》
事实上RDFa是为Xhtml2开发的,后来迁移到Xhtml1.0上,要想使用RDFa,则文档必须有XML的性质,这就麻烦了。将来非常流行的Html5不是XML,在非XML的 HTML里无法使用XML 命名空间。而Html5已经有比较完善的语义方法了,那么RDFa何去何从?
参见
http://edward.oconnor.cx/2009/05/microdata-microformats-and-rdf
http://www.w3.org/TR/rdfa-in-html/
http://www.w3.org/TR/2010/WD-rdfa-in-html-20100304/
http://www.w3.org/TR/2010/WD-rdfa-core-20100422/
http://www.w3.org/TR/2010/WD-html-markup-20100304/
http://www.w3.org/TR/2010/WD-xhtml-rdfa-20100422/
http://www.whatwg.org/specs/web-apps/current-work/multipage/microdata.html
Property | Value |
name | Hedral |
http://example.com/fn | Hedral |
desc | Hedral is a male american domestic shorthair, with a fluffy black fur with white paws and belly. |
http://example.com/color | black |
http://example.com/color | white |
img | …/hedral.jpeg |
TortoiseHg 是一个跨平台的 Mercurial 分布式版本控制系统的可视化客户端工具。Mercurial 是一个跨平台的分布式版本控制软件,和Git一样。
有个图形界面感觉还是不错的。我的系统环境是Ubuntu。
#! /bin/bash
#添加tortoisehg和mercurial的源
sudo add-apt-repository ppa:tortoisehg-ppa/releases
sudo add-apt-repository ppa:mercurial-ppa/releases
sudo apt-get update
#安装tortoisehg和mercurial的源
sudo apt-get install mercurial python-nautilus tortoisehg
#集成nautilus
mkdir -p ~/.nautilus/tortoisehg/src/ && cd ~/.nautilus/tortoisehg/src/
hg clone https://bitbucket.org/tortoisehg/stable tortoisehg
mkdir -p ~/.nautilus/python-extensions/
ln -s ~/.nautilus/tortoisehg/src/tortoisehg/contrib/nautilus-thg.py ~/.nautilus/python-extensions/
重启就OK啦
ibus-sogoupycc 一个非官方的搜狗云拼音客户端。
使用起来很顺手,不过有时会假死,而且有时词语排序不大恰当。不过感觉很有潜力。
以前花了很多的时间思考如何能完成语义,后来发现只是本体论的皮毛而已。不过同时也觉得语义网离我们实在是太遥远了 ,总不能所有的开发人员都学会了语义网才行吧,有这时间都能实现共产主义了。
最近,学习Neo4j,看到了一个PPT:
这篇PPT中提及了GGG,中文名为巨大全球图。
以下我写的对是巨大全球图的解释,不是很全,有什么不对,万望斧正。
巨大全球图 (或 GGG) ,是万维网的发明人Tim Berners-Lee在他的博客中提出了新概念.[1] 生物学家对药品,基因感兴趣。商人则是客户,产品,销售等等。而我们都会对朋友,家庭,同学感兴趣。你是否有这样的挫折感: 你有一些朋友,Web提供了一些分开的服务,如微博,博客等等。有的在FaceBook,有的在LinkedIn,等等等等。当你加入了一个新的照片分享站点的时候,你需要告诉你所有的朋友来添加你为好友。网站都是分开的,内容也是分开的,虽然是同一个人,但系统很显然不知道,他们是一回事。总有一些公司试图包揽一切网络用户,提供统一的体验,但很显然没人能做到。 这是我和我的朋友的心声,有一个"Social Network Portability"社区,但社区网站对此并不感兴趣。网页上的链接是社会网络本身,而不只是网页上的链接。 Tim Berners-Lee认为类似于Facebook社交网站可以构成一个社交网络。他假定人们可以利用"图"来区分整个的网络。巨大全球图是比语义网来的更为贴切的称呼。
GGG提出了社交网络即语义网,虽然觉得有些牵强,不过也得到一些启发,就是社交网络包含有大量的语义信息,也许语义网可以率先在这个区域能实现。归结一下其语义有:
如果能将Web上的社交网站信息加以整合,会达到什么效果呢?
微软有一个人立方的搜索引擎,以搜索资讯为主。根本无法用在普通人身上。
于是,一个名为FriendMap的项目即将幻化出现。他也是一个“人际关系搜索引擎”,但他关注的是普通人的关系和生活。能给一些应用,如校内,提供一些额外的信息支持,同时让普通的互联网用户对人际关系探寻中找到快乐。