Long comments with mostly non-ASCII chars are truncated
Summary
It seems, backend counts comment length in bytes, not in chars, and truncates everything longer than 1500 bytes. However, non-ASCII chars has 2 or event 4 bytes length in UTF-8.
Steps to reproduce
- Copy and paste the following comment in Russian:
Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии.
Frontend shows it has 1025 chars length.
- Post the comment, and it appears as:
Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. П...
Now it has 799 chars length.
I copied it (without trailing three dots) to Python console, and it has exactly 1500 bytes length in UTF-8 encoding:
>>> s = "Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. Проверяем как Майндс обрезает кириллические комментарии. П"
>>> len(s)
799
>>> len(s.encode('utf-8'))
1500