Thursday, December 12, 2013

Семантика послания президента - впервые коснулись офшоров после 2005 года, когда слово еще писали с двумя "ф"


Частота слов в 20 посланиях президента. Интересно. Разные президенты - разный стиль, разные слова.


Про моногорода вспоминали ровно 2 раза. Под катом больше анализа и сами данные.



Корявый, но анализ. (да, надо бы разделить на количество слов и посчитать плотность - у Ельцина просто слов больше)
Ниже - 20 посланий президента с самыми популярными словами (не словоформами) и их частотой в каждом послании с учетом морфологии.
Черт, всю ночь возился с python'ом, чтобы запустить библиотеку склонений для русского языка под windows. Да, как видно из файлов, есть проблемы с работой библиотеки, но это не мешает обнаружить весьма интересные результаты.

https://drive.google.com/file/d/0B1DiSgE7Yta4YzZFNWVYNEJYVGc/edit?usp=sharing

Сами данные -
https://drive.google.com/file/d/0B1DiSgE7Yta4SElmUVpWY3Vlckk/edit?usp=sharing

Вообще, странная штука эти послания. Они не несут почти никакой юридической силы - Федеральное Собрание формально ни к чему не обязано. Нормативным актом они тоже не являются. Это, как известно, скорее обращение президента к народу, чем к законодателям.

Послания Ельцина были чуть больше. У Медведева и Путина - примерно одинаковые.

Всего во всех 20 посланиях 9324 уникальных слова.

Что можно заметить?

1. Президент много "просит" - прошу федеральное собрание то, общественную палату - это. 21 слово "просить", больше чем в любом другом послании. Если серьезно - это может говорить в сторону большего количества узких конкретных мероприятий;
2. В отличие от последних двух президентов, Ельцин никогда не употреблял слова "коллеги";
3. В свою очередь, Путин и Медведев почти не употребяют слов "власть", "федеральный", "государственный", "орган", "политический", "право", "экономический", "порядок". Стили документов отличаются;
4. Последнее и предпоследнее послание делают акцент на ВУЗах;
5. Несмотря на "юбилей" и объединение судов, президент почти не говорил о Конституции по сравнению с предшественниками (семь раз против двадцати у Медведева и пятидесяти у Ельцина);
6. О моногородах за 20 лет вспоминали только в 2013 и 2009;
7. В 2013 году впервые коснулись офшоров после 2005 года, когда слово еще писали с двумя "ф"; (upd. еще в 2012)
8. Общеизвестная вещь с прилагательными: Ельцин - "российский", Путин - "русский";
9. Первый раз за 11 лет ни разу не произнесено слово "демократия"
10. В 2011 году Медведев вспомнил про Лао-Цзы.
11. Провокатор - слово связывающее 2011 и 1996 годы
12. Шесть лет назад бесследно исчезло слово "надежный".
13. Пушкина вспомнили только один раз. В 1999 году. Как и Кириенко.

Да, надо бы подправить данные. Если бы это кто-то читал, мне бы даже было бы не лень)

Я уверен, что там еще много всего интересного. Покопайтесь. Если что-нибудь найдете, поставьте на меня линк за исходные данные, этого мне хватит :)

UPD: Еще немного анализа слов. http://cafedomancie.blogspot.ru/2013/12/blog-post_18.html

No comments:

Post a Comment