|
|
PHP / MySQL Программирование, базы данных. |
 Вчера, 15:07
|
Тестер
Регистрация: 10.10.2006
Адрес: localhost
Сообщения: 828
|
Автоматическая генерация keywords
При больших объемах информации заполнение мета тегов вручную возможным не представляется. Остается генерировать. Есть различные способы и классы, и в каждом свои минусы. Я пошел следующим путем. 30 метров контента (около 2k статей). Из каждой статьи были извлечены 10 часто встречающихся слов. Полученный массив был отсортирован с одновременных убийством дублей. Итого был получен список, где 75% - частицы(etc), 25% - тематические слова. После небольшой чистки был получен список слов, которые в ключевики попасть ну никак не должны. Второй прогон с учетом списка дал результаты намного приятнее.
...
Собственно, привожу список "лишних" слов. Он составлен на основе вышеприведенных действий и далее будет дополняться. Дополняйте его и вы, по желанию, разумеется.
Код:
"без", "больше", "был", "была", "были", "было", "быть", "вам", "вас", "вверх", "видно", "вот", "все", "всегда", "всех", "где", "говорила", "говорим", "говорит", "даже", "два", "для", "его", "ему", "если", "есть", "еще", "затем", "здесь", "знала", "знаю", "иду", "или", "каждый", "кажется", "казалось", "как", "какие", "когда", "которое", "которые", "кто", "меня", "мне", "мог", "могла", "могу", "мое", "моей", "может", "можно", "мои", "мой", "мол", "моя", "надо", "нас", "начал", "начала", "него", "нее", "ней", немного", "немножко", "нему", "несколько", "нет", "никогда", "них", "ничего", "однако", "она", "они", "оно", "опять", "очень", "под", "пока", "после", "потом", "почти", "при", "про", "раз", "своей", "свой", "свою", "себе", "себя", "сейчас", "сказал", "сказала", "слегка", "слишком", "словно", "снова", "стал", "стала", "стали", "так", "там", "твои", "твоя", "тебе", "тебя", "теперь", "тогда", "того", "тоже", "только", "три", "тут", "уже", "хотя", "чем", "через", "что", "чтобы", "чуть", "эта", "эти", "этих", "это", "этого", "этой", "этом", "эту",
Естественно, это далеко не лучший метод выдергивания ключевиков, посему и предлагаю для обсуждения. Фраза "рулит тока дескрипшн" прокатит "тока" с примерами.
Ко всему прочему ключевики игают(в моем случае) и обратную роль. На их основе согласно некоторым правилам в контенте слова заключены в теги, опять же генерация "облака ссылок", которое не пойми кому больше нравится - юзерам или ботам.
Таки вот - какими методами пользуетесь вы? Акцент большие объемы и "слепую" генерацию.
|
|
|
 Сегодня, 07:30
|
Новый пользователь
Регистрация: 15.10.2007
Адрес: г. Пенза
Сообщения: 1
|
Re: Автоматическая генерация keywords
Предлагаю дополнить этот набор набором словоформ (поскольку есть "два", но нет "двух")
__________________
«...даме водки? Это чистый спирт!» © кот Бегемот
|
|
|
Здесь присутствуют: 1 (пользователей - 0 , гостей - 1) |
|
Опции темы
|
|
Опции просмотра
|
Линейный вид
|
Ваши права в разделе
|
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения
HTML код Выкл.
|
|
|
Часовой пояс GMT +3, время: 19:41.
vBulletin v3.6.7, Copyright ©2000-2007
Лицензировано для www.danneo.com
|
|
|