tech_note－FLASHC｜痞客邦

公告版位

新版Blog peichengnote

目前分類：tech_note (35)

瀏覽方式：標題列表簡短摘要

Oct 28 Sun 2012 00:11
Get long live access token from Facebook - Stack Overflow

Get long live access token from Facebook - Stack Overflow
http://stackoverflow.com/questions/10467272/get-long-live-access-token-from-facebook
offline_accessパーミッション廃止時の対応 : Facebook開発者向けドキュメントの日本語訳とTips
http://facebook-docs.oklahome.net/archives/52047013.html

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Oct 26 Fri 2012 15:19
[mahout]run apache mahout examples

run apache mahout examples

官方網站上面有個有個說明，

Recommender Documentation - Apache Mahout - Apache Software Foundation
https://cwiki.apache.org/confluence/display/MAHOUT/Recommender+Documentation

To build and run the demo, follow the instructions below, which are written for Unix-like operating systems:

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Oct 08 Mon 2012 15:10
Zookeeper 與 Hbase 為什麼要用zookeeper

Hbase 使用zookeeper 管理 HMaster 與 RegionServer。
Hbase也就是從BigTable來的，當table大到一個程度的時候，table會split成一個一個的region。
而RegionServer就把 HTable 存到Hadoop的HDFS。
Google BigTable使用Chubby來負責協調Node的工作，而HBase使用的就是zookeeper。

Trend Micro CDC SPN Team | Client HBase RegionServer
http://www.spnguru.com/tag/client-hbase-regionserver/
HBase技术介绍 « 搜索技术博客－淘宝
http://www.searchtb.com/2011/01/understanding-hbase.html

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Sep 21 Fri 2012 11:42
create your own vmware image

create your own vmware image

cd ~/vmware
zip -r Ubuntu12.04.image_120921.zip Ubuntu/

Maybe can remove log file to save disk space
#rm *log

how to use
====

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Aug 19 Sun 2012 13:33
[note] 兩則關於搜尋引擎搜索引擎 search engine

[note] 兩則關於搜尋引擎搜索引擎 search engine

[转发]新浪网招聘搜索引擎研发工程师/数据挖掘和推荐系统工程师(实习生)
2012-07-17 16:33

职位：

搜索引擎研发工程师

职责：

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Jul 28 Sat 2012 16:05
[tech]淺談 partition sort (1

[tech]淺談 partition sort (1

partition sort 就是一種Map Reduce的精神，
其實，在 Google 發表Map Reduce的paper 以前，
我想實際上有遇到"Big Data"的公司，都有這樣類似的解法。
只是後來Hadoop把這件事情吵熱了，
甚至紛紛使用了Hadoop，

不過我對Google內部使用的Map Reduce的framework還是，很好奇。

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Jun 04 Mon 2012 18:20
[talk]Private Cloud

Private Cloud

關於一些設計上面的想法，
用最簡單的方式去完成最複雜的設定。

從使用者的角度出發，
能夠讓他們無縫的轉移使用者經驗。

從硬體上面的價格去支付軟體的開發。

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Jun 04 Mon 2012 18:04
NoSQL Data Modeling Techniques « Highly Scalable Blog

NoSQL Data Modeling Techniques « Highly Scalable Blog
http://highlyscalable.wordpress.com/2012/03/01/nosql-data-modeling-techniques/

這篇文章作為NoSQL　survey的總結，
之前就沒有看到又這麼詳盡的NoSQL概念性的介紹文章。

這個算是從基本的相關出發所做的介紹。

算是一整年survey的複習。

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

May 11 Fri 2012 00:13
[DEnote]120505 Pattern Match Intro

[DEnote]120505 Pattern Match Intro

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

May 10 Thu 2012 16:43
[git]git 常用

增加修改的檔案
$ git add -u

or

增加單個的檔案
$ git add README.md

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

May 09 Wed 2012 14:26
[JS]選擇器 >

在jquery中
有選擇器

這個是選擇 ancestor 下的所有descendant(後代)
$("ancestor descendant")
這個是只選擇子元素
$("parent > child")

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

May 05 Sat 2012 00:30
IR 隨想 0 跋

想不到過了兩年，
才慢慢覺得摸到IR的邊而已。

想抽出一點時間把目前所知的做一點紀錄。

IR 沈寂一時在Big Data的年代，他又好像消失，
其實他一直都在。
因為，Big Data是思維的再改造。
而真正核心的思想，就在IR裏面。

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Mar 29 Thu 2012 13:59
[think][p]Hierarchical Data 階層式的資料怎麼表示

A
aa
dd
bb
B
cc
C
ee
在原始的資料結構要怎麼表示，
像是使用tree的方式。

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Mar 24 Sat 2012 19:26
[Venture]Think

make something people want
i made something people want

唯一的門檻是勇氣

所以東西都在變成軟體，印刷機誕生後，
人類寫過多少個字，未來就有多少家軟體公司。

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

Mar 23 Fri 2012 01:08
[note][p]情境搜索

TechWeb：会不会有更多搜索厂商加入“情境”的发展中来？

孙良：很有可能。“情境搜索”肯定是未来的一个趋势，而之前基于PC侧门户型的个性化搜索比较简单，只是根据用户在PC下留下的一些痕迹来考虑用户的兴趣爱好，比如用户经常搜索的内容、搜索历史、浏览过的网页等。现在的“情境搜索”更加延伸，并能更好的解决用户的长期兴趣与短期兴趣的平衡问题。长期兴趣是指用户所有的搜索过程中产生的一些痕迹，短期兴趣是指用户短期内会关注什么东西。比如说，用户长期关注股票证券类的投资信息，但是短期内，可能对世界杯比较感兴趣。但是如果这两个方面的平衡没有把握好，搜索引擎还是以长期兴趣为主,协同过滤给出结果，这对用户来说就不是最优结果。情境搜索恰好能够解决这一问题，不但考虑用户长期的兴趣爱好，还考虑短期所处的“境”，比如用户当时正好在看世界杯，或者说在看一些世界杯相关的信息，搜索引擎便会提供世界杯信息，而不会还是提供证券类信息来干扰排序。这就是“情境搜索”与普通个性化搜索最大的区别。其他厂商后续也许会引入一些类似的技术，虽然未必会提出“情境”相关的概念，但应该会越来越重视对用户本身的挖掘，因为搜索引擎本身就需要关注两方面数据：一是互联网上已有的数据，包含一些暗网数据；另外就是为了了解用户真正想要的东西，所需要掌握的“情”和“境”。

TechWeb：“情境搜索“的行业意义是？

孙良：情境搜索指明了未来搜索发展的方向。这是因为搜索发展至今，一直没有解决好对人的理解，小小的搜索框是没有办法确切表达用户的信息需求的，所以在这种模式下无论对数据侧如何进行加工，包括爬更多的数据量或补充更多的暗网数据，解决的都是数据的保有问题，而没有解决对用户的理解问题。也就是说，在传统搜索框模式下，信息含量较小，信息密度不高，不足以表达用户的真正需求。而情境搜索则更多的考虑对用户本身的理解，它将提供符合用户应用场景、更贴近用户的智能化搜索，这符合搜搜更懂你的发展战略，同时也代表着未来搜索的研究方向和目标。

TechWeb：“情境搜索“领域是否有1.0或2.0的发展版本之说？或者说有哪些发展阶段？

(繼續閱讀...)

peicheng 發表在痞客邦留言(0) 人氣()

個人分類：tech_note

«12

月曆

«	三月 2025					»
日	一	二	三	四	五	六
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

近期文章

文章彙整

所有文章列表

最新迴響

我的連結

參觀人氣

本日人氣：
累積人氣：

RSS訂閱