pgregory.net/rapidを使ってGoでProperty Based Testingをやってみた

はじめに

以前から Go で Property Based Testing をやってみたいと思っていたのですが @objectxplosive さんの ツイート を見て pgregory.net/rapid package · pkg.go.dev を試してみたのでメモです。

Property Based Testing について

@dgryski さんの ツイート で紹介されていた The lazy programmer’s guide to writing thousands of tests - Scott Wlaschin - YouTube が分かりやすかったです。 この動画では Go 言語ではなく別の言語 (Haskell?) を使って説明されています。

通常のユニットテストではサンプルの入力データをテストケースとして用意し、それをテスト対象に投入して出力や結果を確認します。 境界値などを考えながらテストケースを準備するわけですが、開発者が予想もしないような入力は漏れてしまいがちです。

Property Based Testing はランダムなテストケースを生成してテストを実行することで想定外の入力もカバーするようなテスト手法です。 予め自分で用意したテストケースの場合はその個々のケースに対して出力を事前に準備しておくことができます。

しかし、ランダムなテストケースに対しては事前には準備できないので、入力に対して出力が必ず満たす法則や特性のようなものを考えて、それを満たすことを確認します。

その特性が property で、なので Property Based Testing というわけです。

例えば足し算の場合は以下の特性が考えられます。

※1: 検索しても一般的な訳語が見つけらなかったので今適当につけました。

上の 3 つは加算に対する Property Based Test の最終形ですが、上記の動画では順を追って説明されているので、気になる方はぜひご覧ください。

さらに、動画では Shrinking についても説明されています。

ランダムな入力値で property を満たさないケースが発見された後、その失敗を再現する最小限の入力を探すことをそう呼ぶようです。 Shrinking にも説明がありました。

テスト対象が状態マシンの場合、失敗が見つかったときの入力のステップ数が膨大な場合もありえます。 すると再現テストを動かすのに時間がかかって効率が悪いので、最小化するということのようです。

pgregory.net/rapid パッケージ

レポジトリは flyingmutant/rapid: Rapid is a Go library for property-based testing that supports state machine (“stateful” or “model-based”) testing and fully automatic test case minimization (“shrinking”) にあります。 Go で書かれていてライセンスは MPL-2.0 です。 2020-07-26 時点ではバージョン v0.4.0 です。 README によると今はアルファで、今後 API が非互換で変更される可能性があるとのことです。

stateless な property based test

API ドキュメントを参考に上記の動画で説明されていた足し算のテストを書いてみたのが property-based-test-example/add_test.go です。

一部を以下に抜粋します。

func TestAdd(t *testing.T) {
  t.Run("commutativity", rapid.MakeCheck(func(t *rapid.T) {
    x := rapid.Int().Draw(t, "x").(int)
    y := rapid.Int().Draw(t, "y").(int)
    result1 := add(x, y)
    result2 := add(y, x)
    if result1 != result2 {
      t.Fatalf("add must be commutative, x=%d, y=%d, result1=%d, result2=%d", x, y, result1, result2)
    }
  }))

動画では足し算の特性 (property) を表す関数をテストライブラリに渡すという方式でしたが、pgregory.net/rapid パッケージでは Go のテストとして標準的な書き方に合わせていて、失敗する場合は t.Errorf などを呼ぶという API となっています。

ただし、 *testing.T とは別に独自の *rapid.T という型があって、そちらの Errorf などのメソッドを呼ぶのが Go の通常のテストとは違うところです。

またランダムな入力値は rapid.Int() などで *rapid.Generator のインスタンスを作成し、 Draw メソッドや Example メソッドで値を生成します。

上記の add_test.go はそのままだとテストが通る状態ですが、 add.goadd 関数の実装を return x - y などとわざと間違えてテストを実行してみると以下のようになります。

$ go test -v
=== RUN   TestAdd
=== RUN   TestAdd/commutativity
    TestAdd/commutativity: add_test.go:10: [rapid] failed after 0 tests: add must be commutative, x=0, y=-1, result1=1, result2=-1
        To reproduce, specify -run="TestAdd/commutativity" -rapid.seed=1595763150563185679
        Failed test output:
    TestAdd/commutativity: add_test.go:11: [rapid] draw x: 0
    TestAdd/commutativity: add_test.go:12: [rapid] draw y: -1
    TestAdd/commutativity: add_test.go:16: add must be commutative, x=0, y=-1, result1=1, result2=-1
=== RUN   TestAdd/associativity
    TestAdd/associativity: add_test.go:19: [rapid] OK, passed 100 tests (48.497µs)
=== RUN   TestAdd/identity
    TestAdd/identity: add_test.go:27: [rapid] OK, passed 100 tests (42.924µs)
--- FAIL: TestAdd (0.00s)
    --- FAIL: TestAdd/commutativity (0.00s)
    --- PASS: TestAdd/associativity (0.00s)
    --- PASS: TestAdd/identity (0.00s)
FAIL
exit status 1
FAIL    github.com/hnakamur/property-based-test-example 0.007s

To reproduce, の後に今回の失敗を再現するための go test の引数を出力してくれています。 上記の例だと以下のように実行すれば再現できるというわけです。

go test -run="TestAdd/commutativity" -rapid.seed=1595763150563185679

今回の例は実装が単純なので間違いは明らかですが、実際のケースではデバッグログ出力などを追加して再現テストを実行するというのを繰り返していけば、問題の原因が調査できます。

stateful な property based test

上記の add 関数は stateless でしたが、 stateful なテスト対象の場合は StateMachine というインタフェースを実装した構造体を定義してテスト対象をラップします。

Run(m *SateMachine) func(*T) 関数の を展開するとコード例が見られます(リンク先に飛んで少し上にスクロールバックすると Example (Queue) というのがありますのでクリックして展開してください)。

この例では Queue 構造体がテストの対象ですが、テストを実行するための状態遷移マシンとして queueMachine という構造体を定義しています。

queueMachineInit メソッドで初期化処理を実装します。 初期化が不要な場合は Init メソッドは省略可能です。

また後処理が必要な場合は Cleanup メソッドに実装します。

なんらかのアクション(操作)を行った後、状態遷移マシンがあるべき状態を満たしているかを確認する処理を Check メソッドに実装します。

それ以外のメソッドに各種アクションを実装します。

Run 関数のドキュメントにある通り、最初に Init を呼んで Check で確認し、その後はランダムにアクションを呼んで Check で確認を繰り返します。 Cleanup メソッドがあれば、最後に後処理の際に呼び出します。

ドキュメントでは概要ということで for は無限ループになっていますが、実際は十分な回数を実行したあと終了するようになっています。

状態遷移マシンは初期パラメータごとに型を定義する必要あり

Run(m *SateMachine) func(*T) 関数のドキュメントに書かれていますが、 Init の前に状態遷移マシンを生成する疑似コードは m := new(StateMachineType) となっています。

つまり引数の m *StateMachine のインスタンスがそのまま使われるわけではなく、その型情報を使って reflect でインスタンスを生成するようになっています。 m の中のデータは無視されると明記されています。

ですので、初期パラメータを変えたい場合はそれごとに型を定義する必要があります。

実際の例がこちらです。 all_actions_test.go#L13-L108

長いので抜粋するとこんな感じです。

type allActionsMachineSmallSum0 struct{ allActionsMachine }

func (m *allActionsMachineSmallSum0) Init(t *rapid.T) {
  m.allActionsMachine.retentionDefs = "1s:2s,2s:4s,4s:8s"
  m.allActionsMachine.aggregationMethod = "sum"
  m.allActionsMachine.xFilesFactor = 0.0
  m.allActionsMachine.Init(t)
}

type allActionsMachineSmallSum05 struct{ allActionsMachine }

func (m *allActionsMachineSmallSum05) Init(t *rapid.T) {
  m.allActionsMachine.retentionDefs = "1s:2s,2s:4s,4s:8s"
  m.allActionsMachine.aggregationMethod = "sum"
  m.allActionsMachine.xFilesFactor = 0.5
  m.allActionsMachine.Init(t)
}

独自の型のランダムな入力値は rapid.Custom 関数を使って生成する

上記の足し算のテストでの失敗例を見ると、その時の入力値が出力されます。

    TestAdd/commutativity: add_test.go:11: [rapid] draw x: 0
    TestAdd/commutativity: add_test.go:12: [rapid] draw y: -1

独自の型の値の場合は Custom 関数でカスタムのジェネレーターを定義してそれを使うと、失敗時の値が同様に出力されるので便利です。

Custom 関数の例 にシンプルな例があります。

私が書いた実際の例がこちらです。 generator_test.go#L39-L56

func NewPointsForArchiveGenerator(db *WhispertoolDB, archiveID int) *rapid.Generator {
  return rapid.Custom(func(t *rapid.T) Points {
    var points Points
    now := whispertool.TimestampFromStdTime(clock.Now())
    archiveInfo := db.ArciveInfoList()[archiveID]
    step := archiveInfo.SecondsPerPoint()
    oldest := now.Add(-archiveInfo.MaxRetention()).Add(step)
    fillRatio := rapid.Float64Range(0, 1).Draw(t, "fillRatio").(float64)
    for timestamp := oldest; timestamp <= now; timestamp = timestamp.Add(step) {
      ptFillRatio := rapid.Float64Range(0, 1).Draw(t, "ptFillRatio").(float64)
      if ptFillRatio < fillRatio {
        v := rapid.Float64().Draw(t, "v").(float64)
        points = append(points, whispertool.Point{Time: timestamp, Value: whispertool.Value(v)})
      }
    }
    return points
  })
}

失敗時には値は fmt パッケージの書式 %#v出力されます

そこでテストのときのみ %#v の出力形式を変えるために、テスト専用の構造体を用意し fmt.Formatter インターフェースの Format メソッドを実装するようにしてみました。

generator_test.go#L10-L14

type Points whispertool.Points

func (pp Points) Format(f fmt.State, c rune) {
  f.Write([]byte(whispertool.Points(pp).String()))
}

Property Based Testing で既存の別実装との挙動の互換性を確認する使い方もある

上記の動画でも例として紹介されていますが、テスト対象の実装と同じ実装をテスト側にも書いて同じ結果になることを確認するのは無意味です。

ですが、既存の別実装があってそれが正しい挙動をすると分かっている場合、自分の代替実装がその別実装と同じ挙動をするということを Property Based Testing で確認するのは有効な活用方法です。 上記の動画では test oracle と呼ばれていました。

おわりに

pgregory.net/rapid パッケージはまだアルファとのことですが、手軽に使えることが分かったので今後活用していこうと思います。