2015-12-28

TOEICのリスニングCDを分割するWebアプリを作った

TOEICのリスニング問題集をやっていて「ムキーッ！」となることありませんか？

私は２つほどあります。１つは「ひとつの問題を繰り返して聞きたいのにファイルが分かれていない」こと、もう１つは「何を言ってるのかさっぱり分からない」ことです。そこで今回、１つめの問題を解決すべく、CD音源を複数の問題別に分割するWebアプリを作りました。

Wave Cutter for TOEIC®（Source）

f:id:jinjor:20151228012935p:plain

Chrome、Firefox、Edgeで動作確認済みですので、ぜひ遊んでみてください。

使い方

MP3ファイルを読ませると自動的に空白を判断して分割します
自動分割で上手くいかなかったところを手動で調整します
完了ボタンを押すとZIPファイルが手に入ります

2に関しては、出力予定のファイル名（左側）と波形データの内容（右側）を一致させるゲームだと思うと手っ取り早いです。

主な機能

波形の削除、分割、結合、再生
分割後のファイル名の付け方の指定
Undo/Redo
自動保存

技術的な解説

大掛かりなフレームワークに飽きてきたのでミニマルな感じで攻めてみました。

Virtual DOM

Virtual DOM実装としてSnabbdomを使いました。理由は以下です。

軽い: コアが200行程度
簡潔な記法: h('div#foo.bar.baz')のようにNodeがさくさく書ける
Hook機能: パッチを充てる前後などに処理を書ける

Hook機能は、canvas要素のようなVirtual DOM的な思想から外れるものを扱うときに便利です。今回は音声処理という重い処理を扱うので、Modelが変更されていなければrenderXXX()を走らせないということもしています。

それから、requestAnimationFrame()を使ってレンダリングの頻度を抑えています。これはModelからViewを生成する関数が純粋であることが前提です。

簡易Flux

ライブラリなしで簡単にFluxしました。

Actionを溜めておくことでUndo/Redoへの対応が楽になりました。最初の状態とActionのリストさえ覚えておけば任意の状態を再計算できます。ただし全てのActionを溜めてしまうと、hoverやらtickみたいな頻度の高いActionに汚染されてしまうので最小限に。言い換えると、Undo/Redoを完全にフレームワーク任せにすることはできません。

今回はModel(Store)をObserverにする必要は無いのでカット。というより、ModelからViewへの紐づけをObserverでやるのはBackbone.jsでカオスになった事があって懲りています。

File API

読み込みと書き込みに使用。

Web Audio API

音声処理に必須です。

Web Workers

編集後、MP3に再エンコードする時に画面がフリーズしたので急遽導入。

用途をTOEICに限定するメリット

無駄に汎用的に作りたくなる気持ちを封じることでメリットを出します。

空白時間はおよそ決まっているので、ユーザーがしきい値などを設定する必要がない。
波形の分割ポイントを「空白の最後（次の波形の直前）」に限定できるので、分割ポイントを選択しやすい。
ファイル名の付け方のパターンが決め打ちできる。例えば、Part3からは41-43.pm3などの名前が嬉しいと分かっている。

まとめ

最新のWeb技術を使って役立ちそうなものを作ることができました。残タスクは以下です。

MP3エンコードの高速化
メモリ不足対策
CDによる差異を埋めるために分割ロジックを賢くする
UIを洗練させる
リスニングを克服する

以上。

2015-08-28

OSS関係で英語を書くときに心がけていること

f:id:jinjor:20150828091646p:plain

最近、OSS関係でGitHubとかMLとかに顔を出していて、当然ながら会話は全部英語。

というわけで、英語を書くときに心がけていることを簡単に書く。

「英語が下手ですいません」とか前置きしない

読めば下手だって分かるから、わざわざ言う必要ない。これ言ってる人を見かけるとほぼ確実に日本人なんだけど、必要以上に卑屈なオーラを感じるので良くないと思っている。いくら日本人が英語苦手とは言え、英語圏の人は糞な英語に慣れてるから大体分かってくれるし、分からない場合はこういう意味かとレスが来るから、その都度説明すればいい。ただし後にも書くように礼儀は必要なので、甘え切って雑になるのはよろしくない。逆に丁寧に書けば懸命さが伝わり好印象。

あと、日本人以外にも非ネイティブは沢山居ると思うと結構気が楽。自分の感覚としては非ネイティブの書く英語ほど分かりやすい気がしていて、ネイティブの方が表現が小洒落てて時として全く分からない。

相手に通じる事が第一

自分も文法とかめっちゃ気になっちゃうんだけど、格好つけて洒落た表現にした結果通じないとかもう本末転倒なので、次のように心がける。

相手に通じる >>>>>> 文法の正しさ、簡潔な表現、etc.

一文が長くなって接続詞やら関係代名詞とかゴロゴロしてきたらブツ切りにして複数の文にしていいし、短い表現で分かりにくければとことん具体例を書いて説明する。あとは日本語でも良くやっちゃうけど、「～～みたいな時に悩むっていうか。どうしようか。」みたいな曖昧な訊き方は避ける。お前は何で困っててどうしたいんだ！？ってなるので、ちゃんと説明したほうがいい。ネイティブ同士でもここを疎かにしていると普通に会話が通じていなかったりする。裏を返せば、自分が理解できないのは英語力のせいとは限らない。

積極的かつ無礼でないというバランス

慣れてくると今度はラフにあれこれ発言し始めたりするんだけど、最低限の礼儀なりルールみたいなのは普通にみんな守っているので、そこは外さないようにする。例えば、Issue立てる前にまず既存のIssue検索しろよとか。その辺はもう言語が英語だろうがなんだろうが関係ないので、調子に乗って羽目を外さないようにする。

よく日本人は空気読むとかおもてなしがどうのとか言うので、なんか海外の人は基本ラフで言いたいことは気にせずガンガン言っちゃうイメージあるけど、なんやかんや万国共通だなと思うことはある。「あ、これ本当は言い辛いんだけど角が立たないようにこういう言い回ししてるんだろうなぁ」みたいな事もよくある。

ノリは周りに合わせる

普段英語を使わないので、自分で書いている文章のニュアンスが分からなかったりする。特に、敬語、丁寧語、口語、俗語あたりは本当に分からない。通じればいいと書いたばかりなんだけど、それでもなんとなく「いやマジで俺に言わせればこうすべきだと思います」みたいな風になりたくないので、適当に周りに合わせている。YesなのかYeahなのか、canなのかcouldなのか、Iなのかweなのか。あまり俗っぽい言い回しは理解できても自分で言うのは避けるとか。あと、顔文字も便利。

少しずつ表現を覚える

ここまで書いたのは、とりあえず今の知識でなんとかするっていう話なんだけど、やっぱり限界が来るので少しずつレパートリーを増やすことにしている。例えば、最近覚えたので言うと、意見として「よく分からない」という場合には「I don't know」だと投げやり感があるので「I'm not sure」がベターとか。

こういうのって受験英語で覚えた記憶がない。本当は教科書でガリガリ覚えたいんだけど、正直、２つ目の角を右に曲がって八百屋の正面の郵便局に行くとか、注文した商品が届かなかったから何時から何時の間に電話しなおすとか、遠い世界のような気がしてしまうので半分諦めている。

翻訳ツールとか

読む時に使っているのはGoogle翻訳プラグイン。選択したら訳してくれるので便利。他にも似たのがあるけど、一番シンプルで気に入っている。文単位で訳すことは多分ない…というか、文単位で分からないやつはたいてい翻訳機も誤訳するので。

書く時に分からない単語は、普通にググるとWeblioが大体トップに出てくるのでそれを使っている。ただどうしても複数の候補が出てしまうので、例文を読んで一番近そうなものを選ぶ。それでもしっくり来ないときは別の表現を考える。

最後に

色々言ってるけど、間違えたときに正してくれる人が居ないので、普通に間違え続けている可能性が大いにある。でもそういう人を探すのは別のコミュ力が要るのでハードルが高い。

2015-08-17

cabal install/build 時に実行時に参照するファイルを含める方法

Haskell

やりたいこと

いまいち上手く日本語に出来なかったので図解する。

f:id:jinjor:20150817141116p:plain

コマンドラインツール等で、実行時に手元のファイルをテンプレートとして利用したり、静的ファイルをディレクトリごとコピったりしたいことが良くある。でもそのままExecutableにするとファイルが付いてこなくてどうしよう、と言う話。上の図で言うと、赤い矢印で示したファイル参照を実現したい。

.cabalファイルの記述

実行時に必要なファイルを.cabalファイルに記述する。Data-dir:に必要なディレクトリ、Data-files:にそのディレクトリ下のファイルを羅列する。この指定が曲者で拡張子がワイルドカードに出来ない。なので、/**/*とかにしたいのを我慢しつつ、拡張子をひとつずつ記述する。

foobar.cabal

Data-dir:
  data

Data-files:
  templates/*.html.tmpl
  templates/*.js.tmpl
  assets/*.svg
  assets/*.ico
  assets/*.png

Haskellから呼び出す

foobarというパッケージに付随するファイルは、Paths_foobar.getDataFileName :: FilePath -> IO FilePathで呼び出せるようにcabalがコンパイルしてくれる。魔法か。

Main.hs

import Paths_foobar

main :: IO ()
main =
  do
    path <- Paths_foobar.getDataFileName "templates/app.js.tmpl"
    putStrLn path -- 絶対パス

どうなっているのか

手元のWindowsで、インストール先はこんな感じになってた。

C:\Users\UserName\AppData\Roaming\cabal
 ├ bin
 │  └ foobar.exe
 └ x86_64-windows-ghc-7.10.2
     └ foobar
       ├ templates
       └ assets

応用例：インストール時にコンパイルしたファイルを使う

データディレクトリに入れるファイルをインストール時に動的に作りたい場合がある。例えば、配布しているソースは.coffeeで、実際に使うのはコンパイルした.jsという場合。

.cabalファイルで、Build-type: Customとすると、Setup.hsファイルにビルド時に呼ばれるフックを記述できる。内容は略。

foobar.cabal

Build-type: Custom

Setup.hs

（略）

作ったもの

Elmでパッケージを公開する前にドキュメントをプレビューできるツール。

<a href="https://github.com/jinjor/elm-doc-preview">jinjor/elm-doc-preview</a>github.com

参考用にどうぞ。

2015-05-16

スケーラブルなプログラミングのために何が必要か

f:id:jinjor:20150516071422p:plain

Fluxに関する独自解釈と妄想を、何かの翻訳っぽく書いた。

スケールするアーキテクチャ

フレームワークを作る時、我々は「簡単に記述する」ことを第一に考えがちだ。そして、簡単にするための仕組みはウケる。逆に記述量が増えるとウケない。

しかし例外があって、多く書くことによるメリットが受け入れられたときは別だ。例えば、Backbone.jsを使うと記述量が増える事は誰もが認めるところだが、MVCの実現というメリットのために広く受け入れられた。要するにトレードオフなのだ。

ここのところFluxアーキテクチャが注目を浴びているが、書いてみると記述量は相当増える。そもそも登場人物が多すぎる。 Action、Dispatcher、Store、View、それからそれらの間に挟まって仕事をする者達。一体彼らは何をしたいのか。

最近になって分かってきた。これはアプリケーションそのものを抽象化したアーキテクチャなのだと。

Fluxは何がしたいのか

FluxはMVCを置き換えるものとして登場した。本当にそうだろうか。

Actionは必要か

例えば、AngularJSやBackbone.jsはActionを必要とせず、そのままモデルを更新する。あるいはビューが直接モデルを更新するのは責務上よろしくないとか、ロジックの共通化という目的で、例えばコントローラに関数を置いたりする。しかしActionは登場しない。むしろ直接関数を呼び出す方が手軽なのでは？

結論から言うとActionは必要だ。

全ての出来事はデータだ

データベースを普通に使うと大抵は最後に反映された状態のみを保存しているため、それがどういう経緯で作られた状態なのか復元できない。しかし、全てのイベントを保存しておけば、過去から現在の全ての状態が再現できるという考え方がある。そうは言っても無限のリソースを持っているわけではないので、どこかで情報を圧縮することにはなるのだが、確実に言えることはイベントの集積が情報として一番強いということだ。そして関数を適用するにしたがって、計算結果を得る代わりに次第に情報量は減っていく。

こうしておけばDBに専用のフラッシュバック機能は必要ない。

出来事はそれがどのような用途に使われるかを知らない

「いつ誰がどこで何をした」という出来事は、特定の用途には情報過多かもしれない。しかし安易にそれを捨ててはいけない。後からアドホックに追加された機能によって、別の可能性を見出されるからだ。

ある機能は「何をしたか」によって処理を切り替えるかもしれない。しかし後から追加された機能が「どこでそれが行われたか」でフィルタリングして分析を開始するかもしれない。

順番に届いた出来事を好きな人が好きなだけ持っていく

Actionを実際にDBに保存するかはさておき、何らかの手段でそれらはキューの形で運ばれてくる。

同じ情報を使う機能がいくつもあるということになれば、Pub/Subモデルが適している。そういうわけでDispatcherが登場する。 DispatcherはただPub/Subの仕組みを提供するだけで、具体的にどんなSubscriberがいるかには無関心だ。

スケーラビリティは不可逆

このように順序立てて考えていくと、Fluxが見えてくる。

ここで重要なのは、このアーキテクチャは最も理想的なアプリケーションの構造を抽象化したものだということだ。実際に必要か否かに関わらずActionは存在するものだ。だからそれを表現した。

そうなると書きやすさは二の次だ。おそらく目の前の書きやすさにフォーカスするのなら、必要なのはFluxではなくAngularJSだ。 Fluxはもっと大規模を想定する。

最近よく考えるのは「スケーラビリティは不可逆」だということだ。

サーバー台数を横に増やす話ではなく、ここで言っているスケーラビリティとはなるべく同じコードを保ったままアプリケーションの構成を変えられるという意味だ。

マイクロサービスが話題になっているが、何も考えずにモノリシックに書き始めるとマイクロサービスに拡張することは永久に不可能だ。そこで、じゃあ最初から考えろよという話に普通はなるのだが、ここで追求する理想は、考えなくても拡張できる状態になっていることだ。言い換えれば、小さいインフラでも大きなサービスと同じ書き方をしておいてスケーラビリティを確保せよという話だ。小さいうちから大げさに？いや、大げさであると思わせないほど簡潔に表現するのだ。

そのためには、何かしらの言語なりフレームワークが必要だ。 Fluxが出てきた時に確かに「MVCはスケールしない」と言っていたのだが、MVCのスパゲッティ状態を解消する目的という話に発散してしまったようだ。それで、なるほどAltMVCかと思って考え始めたのだが、どう考えてもActionが必要なかった。

しかし、スケーラビリティに注目すると色々と辻褄が合う。そうなると全然フロントエンドだけの話ではない。 全てを支配できる。

以降、追加でスケーラビリティ実現に何が必要かを考えてみる。

本質的でない状態を排除する

主にサーバサイドにおいてスケーラブルなアーキテクチャを指向してアプリケーションを書き始めると、ひとつの気付きがある。

状態を管理する必要が全くないという事だ。

昔からステートレスにしなさいとは言われていたが、Amazonに至っては思い切ってLambdaと表現するなどしている。

言ってしまえば、アプリケーションとはアクションと古い状態を入力として新しい状態を返す関数ということになる。型をつけるとこうなる。ちなみにモナドではない。

application :: Action -> State -> State

ここでいう状態というのは例えばDBなどの事を指していて、決して計算途中の値のことではない。 forループの外にあるsum変数などは本質的な状態ではない。あるいは設計の都合上たらいまわしにして構築されるオブジェクト、これも状態を持つ必要はない。言い換えれば全て純粋な関数で書けるということだ。

関数型言語が必要

しかし我々は「慣れていて書きやすい」という理由で不用意に状態を扱ってしまう。

例えば先ほどの関数で、新しい状態を返す代わりに古い状態を書き換えたらどうなるだろうか。関数の呼び出し側は新旧の値の比較が出来なくなってしまう。実際、このことがReact.jsの最適化を妨げる要因となっていて、Immutableを売りにした類似フレームワークは軒並みパフォーマンスが高い。

他にも有名な例としては、リストから新しいリストを作るときにmap関数を使うかforループを使うか、というものがある。

val newList = oldList.map(_ + 1)

簡潔に書けているが、問題はそこではない。重要なのは、既に並列計算のための準備が出来ているということだ。

val newList = oldList.par.map(_ + 1)

for文でこうはいかない。 手続き型言語では、知らず知らずのうちにスケーラビリティを落としているケースがあるのだ。

何故か。状態を変更する方法だけを提供すべき関数がそれを実際に適用してしまったり、各リスト要素の変換方法だけを提供すべき関数がリストの作り方にまで言及しているからだ。こういう事が平気で起きてしまうのは、純粋関数型言語以外は副作用の有無を区別しないからだ。

しかもだんだん規模が大きくなってくると、どこでそういうことが行われているかが全く分からなくなる。そしていざという時になってHadoopへの移行は無理だね、という話になる。

デフォルト非同期

また少し違う観点で話をすると、Node.jsのような非同期ベースは最早当たり前にあって良い。

Node.jsで現状不満なのは、非同期のほうがコード量が増えるということと、非同期APIと同期APIが全く別の書き方を要求するということだ。しかしこれはシンタックスの問題なので、非同期処理が簡単に書ける言語があれば何の問題も無い。

非同期処理を同期処理の切り替えが自由になるのは都合が良い。 例えば、JavaScriptではlocalStorageが同期APIなのだが、抽象化のために非同期APIでラップするとIndexed DBとの乗換えが楽になる。

もっと言うと、RPCを使ったコードを綺麗に書ける可能性を秘めている。先ほどの.parのように簡単に切り替えられるとか。

最強の抽象化で勝負に出る

総合すると、スケーラブルな言語やフレームワークの要求仕様とは次のようなものだ。

Actionをデータとして扱う ⇒ 通信手段、再現性に対して柔軟
Dispatcherを使ったPub/Sub ⇒ 機能拡張に対して柔軟
Immutableなデータと純粋な関数を使う ⇒ 並行性、物理構成に対して柔軟
デフォルト非同期 ⇒ 同期処理と非同期処理の切り替え、通信手段に対して柔軟

最初から「疎結合」と言えばそれで済んだのかもしれないが、それではコードレベルに落ちないのでこれで良い。

あとはこれを超書きやすくするだけだ。

書きやすくなければ意味が無い。特にImmutabilityや非同期処理の書きやすさは言語レベルのサポートがないと無理だ。頑張れば出来るかもしれないが、やりたくない。そろそろJavaScriptを捨てる時が来ているのかもしれない。

余談だが、Immutabilityはフロントエンドからサーバ、クラウド、インフラ、DB、どこへ持っていっても良いものだという感触がある。色んな意味でリソースが贅沢に使えるようになったおかげだろう。

2015-05-04

React.js+Fluxをやるなら今すぐElmを使うべき理由

皆さん、そろそろElmやりましょう。

Elmって何なの？

Webブラウザで動くFRP(Functional Reactive Programming)言語です。コンパイルするとHTMLやJavaScriptを吐き出します。

Elm

公式サイトに動くサンプルが大量にあるので見てみると面白いです。

どうして今やるの？

これまでElmと言えば、良くも悪くも理想を追求した言語で、一般的なWebの部品(HTML/CSS/JavaScript)と相性が悪く、「まぁちょっとCanvas使っておもちゃアプリでも作るかー」くらいが関の山だったのですが、最近になってその状況は一変しました。

HTMLライブラリのサポート
Ajaxなど非同期タスクのサポート
JavaScriptとAPIを通じて相互接続可能
エコシステムの登場

順序はちょっと忘れましたが、0.14とか0.15で色々出来るようになりました。

import Html exposing (..)
main = h1 [] [text "Hello, world!"]

Webブラウザで動くのにHTMLライブラリが無かったと言うのは意味が分からないかも知れませんが、実はElmは現在のWebの仕組みにとらわれずゼロから考えて作られています。冷静に考えると、そもそもマークアップ用の言語でアプリケーションを作るとか、そっちの方が意味が分かりませんよね？

本当は理想を突き進んでWebのしがらみを全部なくしてしまいたいのですが、現実問題としてはまだ普通にHTMLで組む方が楽できるよね、ということで使いましょうHTML。

あとはライブラリがそろっていない部分をNative(JavaScript)で補えるのも大きいです。これで既存資産も活用できます。ちょろっと試したところWebSocketも出来ました。

React.jsやFluxと何の関係があるの？

一言で言うと、書き方が似ています！！

一応リアクティブ繋がりではあるんですが、最近リアクティブという言葉がバズりすぎていて最早この言葉を使う意味がありません。どちらもHTMLを宣言的に記述できるようになっています。

見るのが早いので見に行ってください。言語作者が自前で書かれているTodoMVCのソースです。

https://github.com/evancz/elm-todomvc/blob/master/Todo.elm

わずか約350行でTodoアプリ全体が表現されています。

Elm作者のEvanという方は以前からMVC的な設計を強く意識していて、コードに色濃く現れています。冒頭のコメントを以下に抜粋します。

 1. Model  - a full definition of the application's state
 2. Update - a way to step the application state forward
 3. View   - a way to visualize our application state with HTML
 4. Inputs - the signals necessary to manage events

React.js+Flux流に解釈するとおよそ次のようになります。

名前	役割
Model	アプリケーションの状態を定義する。FluxのStoreに相当。
Update	状態を更新する。FluxのDispatcherに相当。
View	状態をHTMLとして表現する。ReactのComponentに相当し、FluxのActionを発行。
Inputs	入力を管理する。

と書いていますが、何か特別な言語仕様やフレームワークがあるわけではありません。単にそういう風に分けて設計しましたという話です。実際にはAjaxなどでサーバとやり取りする必要が出るはずですが、大枠は変わらないと思います。

そして、DOMのレンダリングを高速化するためにVirtual DOMが使われています。

実際、View部分の記述は本当にReact.jsのrender()そのままで、コンポーネントツリーの上から順にデータを渡して宣言的にHTMLを記述していきます。イベントをアクションとして発行して最終的にコンポーネントツリーにフィードバックさせる構造はFluxと同じです。

言語としてのアドバンテージ

React.jsをやっていると、JavaScriptの様々な言語仕様の壁にぶちあたります。その点でもElmには以下のような追加の恩恵があります。

Immutability

JavaScriptでは新旧の値を比較する時、古い値を誤って更新しないために並々ならぬ努力が必要です。Immutabilityを実現するためにはライブラリで頑張るしかありません。

Elmの言語仕様は細かい点を除いてHaskellとほとんど同じで、変数ももちろんImmutableです。

型付け

Elmはコンパイル時に静的に型チェックを行います。 JavaScriptとの接続部分に関しては、ブート時にAPIが定義されていることをチェックするのと、Elm側にオブジェクトを渡す際に型のチェックが動的に入ります。

まとめ

React.js+Flux的な事がしたい人にとってElmは既に有力な選択肢です。実際にプロダクションで使うには信頼と実績と見えない力が必要ですが、その辺は気合で何とかしましょう。

ついでと言っちゃなんですが、FRPの流儀が一緒に学べるのもおいしいところです。FRP単体のJavaScriptライブラリを導入するのはメリットが薄くて却下になることが多いと思うので。

というわけで、アーリーアダプターになってElmの実績を作っていきましょう。

以上。

2015-04-14

Herokuと同程度に簡単なOpenShift使用メモ(on Windows)

Heroku有料化に伴いOpenShiftを試した。その時のメモ。

以下、簡単と言いながら色々躓いているがドキュメントは凄く親切なので、基本的にはこれで足りる。

<a href="https://developers.openshift.com/en/getting-started-overview.html">Getting Started | OpenShift Developers</a>developers.openshift.com

アカウントを作る

Webページから（省略）。

コマンドライン ツールのインストール

コマンドラインツールrhcがgemで提供されているので、まずはRuby1系の最新をインストール。 2系だとエラー。

gem install rhc

依存関係で怒られた。

ERROR:  While executing gem ... (Gem::DependencyError)
    Unable to resolve dependencies: rhc requires highline (~> 1.6.11); commander requires highline (~> 1.7.1)

~> 1.6.11という指定は1.6.Xまでしか受け付けないようだ。

gem install highline -v 1.6.11

再度。

gem install rhc

また怒られた。

ERROR:  While executing gem ... (Gem::DependencyError)
    Unable to resolve dependencies: commander requires highline (~> 1.7.1)

gem install rhc failed. Gem::DependencyError · Issue #678 · openshift/rhc · GitHub gemをアップデートしろと。

gem install rubygems-update
update_rubygems
gem install rhc

また怒られた。今度はgemのエラーっぽい。

ERROR:  While executing gem ... (ArgumentError)
    invalid byte sequence in UTF-8

Windows固有の問題らしいので以下を参考に修正。会社の PC で 2 時間ほど悶々と悩んでたこと。 - msfukuiの日記

win32/registry.rb

#FormatMessageA = Kernel32.extern "int FormatMessageA(int, void *, int, int, void *, int, void *)", :stdcall
FormatMessageW = Kernel32.extern "int FormatMessageW(int, void *, int, int, void *, int, void *)", :stdcall
def initialize(code)
  @code = code
  #msg = "\0".force_encoding(Encoding::ASCII_8BIT) * 1024
  msg = "\0\0".force_encoding(Encoding::UTF_16LE) * 1024
  #len = FormatMessageA.call(0x1200, 0, code, 0, msg, 1024, 0)
  len = FormatMessageW.call(0x1200, 0, code, 0, msg, msg.size, 0)
  #msg = msg[0, len].force_encoding(Encoding.find(Encoding.locale_charmap))
  msg = msg[0, len].encode(Encoding.find(Encoding.locale_charmap))
  #super msg.tr("\r", '').chomp
  super msg.tr("\r".encode(msg.encoding), '').chomp
end

再度。

gem install rhc

出来た。

コマンドライン ツールのセットアップ

rhc setup

色々訊かれるので、問題なければデフォルト値とyesをひたすら選択。途中、さっき作ったアカウントでログイン。 SSH鍵の作成から公開鍵を登録するところまでやってくれる（秘密鍵は手動で読み取り専用にしろと書いてある）。

Node.jsアプリケーションの作成

多分Node.js以外も同じようなプロセスになるとは思う。 URLはhttp://アプリ名-ドメイン名.rhcloud.com/になるので慎重につける。（後からでも変更できるけど面倒）

アプリケーション作成Webからでも出来るが、ここではコマンドで作成。 Node.jsの場合はカートリッジ名をnodejs-0.10とする。

rhc create-app home nodejs-0.10

最初のアプリケーションを作る場合はここで名前空間（ドメイン）を訊かれるので入力。

怒られた。

The authenticity of host 'home-jinjor.rhcloud.com (54.166.221.17)' can't be established.
RSA key fingerprint is 
Are you sure you want to continue connecting (yes/no)?

ここに至る前に仮に作ったドメインが気に入らなくて消したりしたせいかも。もう一度セットアップ。

rhc setup

Web画面からアプリを消して再度作成する。

rhc create-app home nodejs-0.10

今度は通った。IPアドレスやら何やらが付与される。

この時点で、http://home-jinjor.rhcloud.com/に既にデフォルトアプリが立ち上がっているので見に行く。

開発を進める

先ほど作ったアプリのルートに移動して、Gitのリモートリポジトリを一応確認しておく。

git remote -v

何故か.gitignoreが無かったので追加。

echo node_modules > .gitignore

後はいつものようにNode.jsアプリを起動。

npm install
node server

http://localhost:8080/にアクセスして確認。

ソースも確認。

self.ipaddress = process.env.OPENSHIFT_NODEJS_IP;
self.port      = process.env.OPENSHIFT_NODEJS_PORT || 8080;

Herokuと同じく、主要な情報を環境変数から取得しているのが分かる。 Herokuと同じなら、DB等のアドオンの情報も環境変数から取得できるはず。

修正したらプッシュ。

git push origin master

自動的に再デプロイされる。

感想

Herokuと同じ。

2015-04-07

HTTP/2で再帰的にPUSH_PROMISEするための最速アルゴリズム

話の発端

サーバプッシュするリソースの関連付けを全部手動で書くのが面倒だから、動的に中身を読んで解決したい。その時に、依存の深いところにあるものでも、リクエストのストリームを閉じずに待たないといけないという制約があった。

<a href="http://jinjor-labo.hatenablog.com/entry/2015/03/11/150229">HTTP/2で再帰的にPUSH_PROMISEする場合の注意点 - ジンジャー研究室</a>jinjor-labo.hatenablog.com

というわけで、依存が深くてもなるべく早くコンテンツを返すためのアルゴリズムを考えた。形式的な説明が思いつかないので具体例を挙げる。

例１

index.htmlがstyle.cssを必要とし、style.cssがback.pngを必要としている。（階層の深さ:2）

index.html

<link rel="stylesheet" href="style.css"></link>

style.css

body { background: url("back.png"); }

最適なレスポンス順序

index.htmlに直接関連するリソース（ここではstyle.css）をPUSH_PROMISEした時点でindex.htmlのコンテンツを返す（この時点ではストリームを閉じない）。それ以上深いリソースのPUSH_PROMISEがすべて終わってからストリームを閉じる。

f:id:jinjor:20150407115139p:plain

back.pngを待たずにindex.htmlの全体を送って良い。なぜなら、ブラウザがindex.htmlをパースしてもback.pngが必要だという情報は得られないから。

例２

index.htmlがstyle.cssとapp.jsを必要としている。（階層の深さ:1）

index.html

<link rel="stylesheet" href="style.css"></link>
...
<script src="app.js"></script>

最適な順序

ストリームで細切れにすればより速い。ブラウザがサブリソースをリクエストしないことを保証したら、その部分のコンテンツを直ちに送りつける。

f:id:jinjor:20150407121006p:plain

まとめ

なるべく早くコンテンツを返してブラウザのパースを早める
実装大変そう