Jul 20, 2015 17:52
Занимались на работе корпусами -- оценка качества данных для аннотации. У всех людей проблемы как проблемы. У русских данных проблемы, натурально, следующие: порнография, стихи, мат -- и еще цветочки юникодом в документ как-то случайно вставились.
cl,
свитер_с_оленями