▲ Наверх

Внимание: Я русскоязычный житель Харькова категорически против военного вмешательства России во внутренние дела Украины. Россияне, не верьте вашим руководителям-политикам. Я говорю на русском языке и никаких проблем из-за этого никогда не испытывал. Ни в Харькове, ни в Киеве, ни во Львове. Истерия нагнетается российскими СМИ/'русско-патриотическими блоггерами', будьте благоразумными. Главная опасность для меня лично - не бандеровцы-националисты, а ваш плешивый кремлевский фюрер - Путин.

Архив

Архив раздела ‘Лытдыбр’

Исследования текстов

28 июля 2010

Есть такие в мире — британские ученые. У них постоянно какие то интересные исследования проводятся, статистика, взаимосвязи, зависимости…
И я тоже решил попробовать себя в этом интересном деле. А объектом моего исследования стали литературные произведения разных авторов. Мне стало интересно: как выглядит функция распределения по длине предложения у разных авторов. Написав простенький PHP скрипт для анализа текстов, я скормил ему несколько авторов. Современных и не очень, «интеллектуальных» и опять таки — не очень. Результаты выкладываю ниже. По оси х на графиках расположено число символов в предложении, по оси y — относительная частота появления в тексте предложения с данной длиной. Я ограничился максимальной длиной в 300 символов для предложения. Ибо, как видно из приведенных графиков, максимум разыгрывается в районе 40 — 100 символов на предложение. Для анализа брались отрывки текста длиной не менее 200 000 символов.

Итак:
Лев Толстой
Лев Толстой

Читать далее…



Популярный блог Харькова, 2017 год
Тут была Яндекс-метрика