[ スポンサード リンク ]
3件中 1件 ~ 3件 [ ← 前のページへ ] [ 次のページへ → ]
[ ソート ] 日付順注目順
MySQLでの高速な重み付きランダム表示 - llameradaの日記 フィード

Wikipediaめくりでは、MySQLに格納したWikipedia記事をランダムに表示している。速度を気にしないなら、 SELECT * FROM docs ORDER BY RAND() LIMIT 10; で良いのだけど、レコード数が多いと遅くて使いものにならない。そこで、記事IDを1から始まる連番になるようにDBに格納している。このようにすると、アプリケーション側でDBに格納されている文書IDが全て分かるので、ランダムに文書IDを10個選...

 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
MySQL tips 負荷 todo sql
2008/04/14 13:05:28  d.hatena.ne.jp
最速配信研究会 - 画像配信の負荷分散も比較的簡単?(その1) フィード

[http://www.onflow.jp/blog/archives/2006/04/30.html:title=30万個ぐらいの静的ファイルを配信するサーバーの選び方] で静的な配信サーバに関することが述べられている. naoyaさんが公開されてるInside Hatena Bookmark’s Backend の資料などを読むと、mod_perlなサーバーやMySQLサーバーの選び方の参考になったりするわけですが、世の中を見渡してみても、静的コンテンツ(画像とか)を配信するサーバー...

 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
負荷分散 server network Web 運用
2008/02/14 6:30:04  d.hatena.ne.jp
MySQLでTF-IDFの計算、あと2つのベクトルの内積の計算 フィード

SELECT item, tag, log2(tf.times + 1) / log2(total) * (log2(n / df.times) + 1) AS tfidf FROM tf LEFT JOIN df USING(tag) LEFT JOIN (SELECT item, count(tag) total FROM tf GROUP BY item) AS a USING(item) CROSS JOIN (SELECT count(id) AS n FROM items) AS b WHERE item="j"; 実際はユーザ変数を使った方がSQLが短くなっていいと思う。 SELECT @total := count(tag) FROM tf WHERE item = "j"; SELECT @n := count(id) FROM items; SELECT item, tag, log2(tf.times + 1) / log2(@total) * (log2(@n / df.times)...

 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
mysql 自然言語処理 algorithm tf-idf nlp
2008/02/14 6:30:04  txqz.net
[ スポンサード リンク ]
3件中 1件 ~ 3件 [ ← 前のページへ ] [ 次のページへ → ]
データベース情報まとめ | Feed.db