Unroll F32 to BF16 loop - 1.8X faster conversions for LLVM. Use vector pairs for GCC. (!1317) · Merge requests · libeigen / eigen

Unroll F32 to BF16 loop - 1.8X faster conversions for LLVM. Use vector pairs for GCC. Other minor improvements.

Unroll F32 to BF16 loop - 1.8X faster conversions for LLVM. Use vector pairs for GCC.