experimental の `default_dtype` がPERの設定に反映されない

ReplayBufferのオブジェクトを生成する際の引数に default_dtype=np.float32 を指定してもPrioritized Experience Replayの設定には反映されないため、型不一致(weightsだけfloat64)のエラーが発生する。