用 Google 搜尋:

無聊人的無聊故事

六月 25 日, 2007

從日本 Yahoo! 查詢日文歌詞

文章類別:好物共享, 音樂欣賞 — by C.H.Weng @ 2:02 上午

話說在前兩天要貼前一篇文章的歌詞時,找了很多地方反覆比較後,發現 Yahoo!ミュージック - 歌詞算是一個相當完整而且免費的資料庫。

這個資料庫不僅收錄的歌詞數量夠多,而且歌詞完整、錯誤又少,如果可以直接將文字丟到 Word 裡面去標上讀音,就算只會五十音,還是可以跟著哼哼唱唱。

可惜的是,直接從 Yahoo! 查詢到的歌詞,文字是以 Flash 動畫的格式被顯示出來的,也就是說不能直接複製,實在是很傷腦筋。不過還好,稍微研究了一下網站架構,發現其實還是有辦法把歌詞嘿嘿嘿出來的…

找到方法後,就順手寫了這個日文歌詞抽取器方便日後使用,也讓有需要的人可以簡單地取得自己想要的歌詞。只要將顯示歌詞的 Flash 網頁所在的網址貼到歌詞抽取器裡,就可以將歌詞輸出為可以複製的內容了喔!

共有 8 條評論

  1. 這個我非常需要,前幾個月發現日本所有大型歌詞網站都改為這種形式還傷腦筋了好一陣呢,請問願不願意把原始碼公開,想知道是怎麼做的>///

  2. 其實說穿了也很簡單,不過這只適用於日本 Yahoo! 的歌詞資料庫。

    舉一首歌為例,假設歌詞所在的網址是這樣:
    http://music.yahoo.co.jp/shop/p/53/274101/Y011222
    那麼把網址稍微變一下,改成
    http://music.yimg.jp/bin/sendlyricstext?ArtistId=274101&Id=Y011222
    就可以了。
    關鍵就在 ArtistId 與 Id 這兩個值而已,這樣的規則應該不難理解吧?
    歌詞抓下來後,因為含有一些 HTML code 並且也沒有斷行,所以再稍微處理一下,讓格式正確就可以了。

    至於其他的日文歌詞資料庫,因為我平常比較少用到,所以暫時也沒什麼研究。

  3. 所以是怎麼去抓到他內部連結的這串網址呢?

  4. >>稍微研究了一下網站架構,發現其實還是有辦法

    立正,敬禮!

    以前好不容易找到一些歌的歌詞,結果被這個 flash 顯示潑了冷水
    我甚至想把網頁印下來,然後再自己慢慢打字,然後再加上時間軸。

    有了版大的這個轉換工具,真的是 "嘿嘿嘿...." 實在太感謝啦。

  5. 要怎麼抓喔?

    看 HTML 原始碼,加上 Wireshark 分析封包,就能找出來了。

    至於說為什麼會知道這個網站可以分析?只能說是一種直覺吧!
    因為她用來顯示歌詞的 Flash 介面都是同一個,所以就聯想到,是用某種方法給這個 flash 檔案賦予一些參數,讓她把歌詞秀出來,而不是每一篇歌詞都要做一個獨立的 flash 檔案。

    有了這個想法之後,順勢找下去,順利的話就可以分析出正確的網址了。
    這種分析方法可以用在很多地方,例如之前寫的 handy hiRadio 也是用類似的方法找出來的。

  6. 原來如此!

    我不久前才剛接觸Wireshark說,還有這種用法啊,真是太感謝了~

  7. Wireshark 算是同性質軟體中最強悍的一套了,
    另外還有許多比較簡單好用的類似程式可用,不過因為各有優缺點,就不在這邊一一介紹了。

  8. 只要將顯示歌詞的 Flash 網頁所在的網址貼到歌詞抽取器裡
    以上這句的網址要怎樣抓呢?
    應該不是頁面上方可輸入網趾的那一欄取下來的吧?
    而且您指的Wireshark是用來抓這個嗎?
    您舉一首歌為例,假設歌詞所在的網址是這樣:
    http://music.yahoo.co.jp/shop/p/53/274101/Y011222
    但頁面上方可輸入網趾的那一欄卻顯着
    http://music.yahoo.co.jp/lyrics/dtl/KAA010530/AAA170474/
    那又是為甚麼呢?
    本人比較笨
    不太明白
    請您詳細指點一下

發表評論

(必須輸入。)
(必須輸入,但不會公開。)
(選擇性輸入、公開資訊。)

不可以 使用 HTML 標籤;你 可以 使用 BBCode 標籤。
目前支援的標籤: b color email i img size strong u url。

Comment Preview
↑Meta↑
↑Authors↑
↓Search↓
↑Categories↑
↑Recent Posts↑
↓Most Popular Posts↓
↑Recent Comments↑
↓Recent Trackbacks↓
↓Archives↓
↓Themes↓
Powered by WordPress™
Valid RSS & Atom Feed