Оптимізація форумів та інших форм спільнот користувачів WWW
Дана стаття була написана і лише зараз опублікована у науковому віснику “Львівської Політехніки”. З організаційних причин вона пролежала 2 роки у видавництві. Тому в цій статті ви не знайдете терміну Веб 2.0, який тоді це просто не існував. Проте, про своїй суті стаття саме про це – як керувати та оптимізовувати Інтернет-спільноти, базове поняття для Веб 2.0
Стаття публікується зі спрощеннями та скороченнями, зокрема без формул, зі спрощеними заголовками, та без деяких ілюстрацій.
У даній статті розглядаються особливості визначення та оптимізації тематики сайтів ряду спеціальних видів, зокрема форумів, блогів, інших форм інтернет-спільнот. Принциповою відмінністю сайтів інтернет-спільнот від традиційних сайтів, що представляють своїх власників, є висока ступінь залежності інформаційного наповнення сайту від його відвідувачів. Така безпосередня залежність відсутня у традиційних представницьких чи інформаційних сайтах.
Дана особливість сайтів інтернет-спільнот різко виділяє їх від решти сайтів при розв’язанні ряду специфічних задач по позиціонуванню сайту в глобальному середовищі. У першу чергу це стосується задачі визначення тематики та її ефективного подання.
Як і для традиційних сайтів, для сайтів інтернет-спільнот тематика породжується інформаційним наповненням сайту, а знаходить своє відображення в аудиторії WWW, яка знаходить дану інформацію, проявляє зацікавлення до неї та використовує її.[17]
Відмінністю ж є те, що сама аудиторія сайту безпосередньо наповнює сайт інформацією, таким чином уже самостійно формує, уточнює та змінює тематику сайту інтернет-спільноти. Крім прямого інформаційного зв’язку “сайт-користувач” має місце і зворотній зв’язок “користувач-сайт”, який для деяких типів інтернет-спільнот взагалі є домінуючим (фактично сайт стає похідним від спільноти).
Існує широкий спектр різних форм та способів реалізації сайтів Інтернет-спільнот. Проте на сьогодні домінуючими формами таких сайтів є наступні:
Далі у статті детальніше розглядатимуться форуми, як найзагальніша форма реалізації інтернет-спільноти та буде проаналізовано особливості інших форм сайтів спільнот.
Метою дослідження є визначення основних підходів до моделювання форумів, їхньої аудиторії користувачів, визначення принципів формування тематики та інформаційного наповнення форумів та методів оптимізації тематики форуму.
Особливості форумів
Форум у задачах визначення та оптимізації тематики (як і в інших задачах, пов’язаних з системними характеристиками WWW) доцільно розглядати як автономний сайт . Навіть якщо він супроводжує існуючий сайт (“форум на сайті”). Для цього є ряд суттєвих причин. [4][14][12]
При розгляді форумів як автономних сайтів важливо також відмітити наявність ряду особливостей, які є важливими в межах задачі, що розв’язується [13][10]. Такими особливостями є наступні.
Модель аудиторії форуму
Модель користувача сайту та форуму
Користувачем WWW вважатимемо людей та програмних агентів, які вирішують певні задачі, здійснючи доступ до сайтів через мережу Інтернет.
Формально користувач описується наступним відношенням:
(основні характеристики, цілі користувача, історія користувача)
де:
основні характеристики – базова інформація, що ідентифікує користувача;
цілі користувача – набір цілей, досягнення яких прагне користувач при роботі в WWW;
історія користувача – історія змістовних дій користувача в WWW.
цілями користувача в системі WWW поділятимемо на наступні класи:
інформаційні цілі – отримання необхідної інформації зі системи WWW;
операційні цілі – здійснення в системі WWW певних операцій (купівля чи продаж товару, відсилання листа електронної пошти і тп);
комунікативні цілі – спілкування в системі WWW з її іншими користувачами.
Важливим підкласом інформаційних цілей користувача є навігаційні (пошукові) цілі – знаходження необхідного ресурсу в системі WWW.
Історія користувача WWW може подаватися як історія транзакцій користувача у системі WWW.
Транзакція – послідовність взаємозв’язаних запитів користувача до сервісів WWW та результатів їхнього опрацювання. Одна транзакція може складатися з багатьох запитів користувача у WWW. Проте, один запит може одночасно входити до кількох транзакцій.
Основними цілями користувачів форуму є інформаційні та комунікаційні цілі. Транзакціями, що здійснюються, для досягення даних цілей, є:
Для кожного форуму перелік можливих транзакцій може відрізнятися, проте наведений вище список є достатньо типовим, особливо з врахуванням тенденції реалізації форумів на базі готового типового програмного забезпечення.
У наведеному списку транзакції впорядковані по зростанню важливості для типового форуму.
Для опису транзакції користувача форуму достатньо одної часової мітки, тобто моменту виникнення транзакції.
Переміщення користувача по форуму, як правило, в силу складності та багатоваріантості системи навігації, є достатньо складним, проте призводить до виконання однієї з перерахованих транзакцій з певним інформаційним наповненням.
Визначення коефіціентів важливості типу транзації сильно залежить від типу форуму та задач, що ставлять перед ним власники. Проте, як правило, важливість типів транзакцій відповідає порядку в наведеному вище списку типів транзакцій. Загальний принцип визначення важливості для типу транзакції наводиться далі.
Чим в більшій мірі дана транзакція впливає на спільноту користувачів та на інформаційне наповнення форуму, тим вона важливіша.
Міра корисності користувача форуму
Для окремого відвідувача (користувача) сайту визначимо міру цінності, що відображає математичне сподівання міри досягення власниками певної цілі щодо цього відвідувача.
Цінність користувача залежить і від цінності конкретних дій, які зробив користувач на форумі, і від важливості типу дії. Модель цінності користувача ускладнена у порівнянні з виразами для звичайного сайту. Це викликане наступним фактором: дії одного й того самого типу можуть суттєво відрізнятися за цінністю для власників форуму.
Зокрема, є важливим наступний факт – цінність окремих дій користувача (як і самого користувача) – може бути від’ємною. Більше того, абсолютні значення від’ємної ціності користувачів може бути значно більшою за значення цінності користувачів з додатним показником цінності.
Даний факт зобумовлюється наявністю механізмів взаємодії між користувачами форуму (такої взаємодії немає на традиційних сайтах). Завдяки можливості впливу на інших користувачів форуму користувач з від’ємною цінністю може чинити небажані дії які руйнують спільноту форуму. Що в свою чергу призводить до небажаної деформації тематики форуму, зменшення активності форуму, пониження авторитетності форуму.
Небажані дії, що мають від’ємну цінність, є досить традиційним явищем для форумів, що зубомовило появу ряду спеціальних термінів (флейм, флуд, офтоп, спам тощо), які відображають такі дії. У загальному випадку небажаними діями користувачів є:
Визначена міра цінності користувача є основою подальшої оцінки цінності аудиторії сайту, її структурування та оптимізації тематики сайту відповідно до цінності його аудиторії.
взаємодія та рангування користувачів
Оцінка цінності користувача на основі цінності його дій на форумі зводиться, в основному, до оцінки цінності дописів даного користувача на форумі та інших форм взаємодії з рештою користувачів.
У загальному випадку така оцінка є трудомісткою та не може бути чітко формалізованою. Проте існує ряд підходів, які дозволяють спростити задачу оцінки цінності користувачів. Загальною ідеєю такого спрощення є використання самої спільноти форуму для формування певної узагальної оцінки. Це дозволяє зменшити затрати на супроводження форуму для власників форуму та реалізувати додаткові механізми формування цілісної спільноти форуму. Зокрема:
Проте такий підхід також має свої недоліки, основним з яких є набуття певної незалежності спільноти форуму від його власників та зменшення можливостей власників по керуванню форумом.
Основними узагальненими оцінками цінності користувача для форуму є наступні величини.
Для визначення авторитетності та цитованості користувача можуть застосовуватися прості міри, такі як кількість цитат чи середня оцінка іншими користувачами, чи узагальнені зважені міри, побудовані по аналогії до міри PageRank.
Визначення та оптимізація тематики форуму
Розглянемо тепер основні підходи до формування тематики форумів.
Для класичних сайтів, що відображають інформацію, сформовану їхніми власниками, основними методами формалізації тематики є:
Проте, оптимізація тематики форуму вимагає суттєво інших дій від власників сайту. Усі перераховані вище методи визначення тематики сайту залишаються актуальними і для форумів (за винятком реклами сайту – для форумів вона використовується досить рідко).
Суттєвими є відмінності у можливостях впливу на тематику форуму зі сторони власників у порівнянні зі звичайними сайтами. Фактично, з наведеного комплексу заходів власники можуть безпосередньо застосовувати лише перші два. А решту заходів (які є за своєю суттю значно важливішими) власники можуть здійснювати в дуже обмеженій або модифікованій формі.
Формування текстового наповнення сайту та розміщення посилань на сайт у повній мірі здійснюється спільнотою сайту. Адміністрація форуму може лише опосередковано впливати та координувати даний процес.
Власники (адміністрація форуму) координує дії спільноти по формуванню тематики сайту маючи в свому розпорядженні наступні засоби та можливості.
Таким чином, тематика форуму має ієрархічний характер.
Розглянемо детальніше кожен з рівнів визначення тематики форуму.
Опис форуму. Використовується при формуванні чільних сторінок форуму, сторінок реєстрації та при формуванні рекламних текстів та прес-релізів. Текст опису форуму повинен бути сформований таким чином, щоби привернути інтерес до форуму у тих користувачів WWW, який мають потенційно додатнію міру корисності для форуму і відвести від форуму користувачів, які можуть бути для форуму шкідливими.
Таким чином, формування якісного опису форуму є спеціальною лінгвістичною та психологічною задачею.
Правила форуму. Використовуються для регуляції подальшого формування нижчих рівнів тематики форуму. Правила форуму унормовують внутрішні процеси самоорганізації спільноти та визначають базові обмеження на інформаційне наповнення форуму (робоча мова форуму, допустима та заборонена лексика, стилістика тощо). Такі обмеження суттєво впливають на результат визначення тематики форуму через пошукові запити. Наприклад, заборона жаргону та ненормативної лексики може суттєво зменшити частку підлітків та людей без вищої освіти в аудиторії форуму. Навпаки, активне стимулювання вживання неологізмів та професійного сленгу може збільшити частку професіоналів в предметній області серед аудиторії форуму.
У сукупності правила форуму визначають для форуму загальну описову характеристику, яка також може вважатися тематичним описом форуму (хоч і дуже поверхневим та неформальним). Прикладами таких описів можуть бути: “україномовний форум для інтелігентного спілкування”, “демократичний форум без цензури”, “форум, де кожен може вільно висловитися”, “фаховий форум без реклами та флейму” тощо.
Метаінформація форуму. Використовується для формування заголовків сторінок, службових повідомлень, спеціальних тегів тощо. Метаінформація повинна формуватися з врахуванням тих же ж вимог, що і опис форуму.
Базове оточення форуму. Під базовим оточенням форуму розуміється множина найважливіших зовнішніх посилань на чільні сторінки форуму, розміщення яких здійснювалося власниками форуму і по яких на форум потрапляє значна частина відвідувачів (принаймні на перших етапах його функціонування).
На практиці базове оточення форуму – це сайт або сайти, для яких даний форум визначено як “форум сайту”.
З точки зору базового оточення форуми класифікуються наступним чином.
• Форуми, що є важливою частиною функціональності сайту і сильно інтегровані в сайт. Такі форуми можуть забезпечувати функцію написання коментарів до статтей, нові повідомлення форуму можуть виводитися на чільних сторінках титульного сайту.
• Форуми, що супроводжують існуючий сайт чи сайти з низьким ступенем інтеграції. Це, наприклад, форуми, для яких на сайті визначено лише посилання в стилі “форум сайту” на чільну сторінку форуму.
• Форуми, що існують автономно, не супроводжуючи жоден сайт.
• Форуми, що породжують супровідний сайт. Популярні автономні форуми часто породжують супроводжуючий сайт для виконання спеціальних функцій (огляд найцікавіших тем форуму, загальна інформація про форум, дайджест форуму, розсилка тощо).
Лише в першому та, в меншій мірі, в другому випадках базове оточення форуму відіграє принципову роль при визначенні тематики форуму.
Структура форуму. Включає розподіл форуму по розділах, список модераторів і їхніх повноважень.
Наповнення форуму. Інформаційне наповнення форуму – тексти повідомлень та додаткова інформація.
Вторинне оточення форуму. Зовнішні посилання на глибокі внутрішні сторінки форуму, в першу чергу – на сторінки дискусій.
Відповідно до наведеної ієрархічної структури тематики форуму має місце наступна схема координації процесу визначення тематики форуму.
Одним з найважливіших аспектів формування тематики форуму та його інформаційного наповнення є наявність зворотнього звязку між тематикою форуму та притоком нових відвідувачів, які далі будуть приймати участь у формуванні наповнення форуму.
Важливість даного зв’язку визначається зокрема тим фактом, що дописувачами форуму можуть ставати користувачі WWW з від’ємною цінністю для форуму (шкідливі для існуючої спільноти форуму). Враховуючи, що збитки, завдані такими користувачами, значно можуть переважити прибутки, отримані від “позитивних” дописувачів, однією з найважливіших задач по координації процесу формування тематики та наповнення форуму є мінімізація загрози руйнування спільноти форуми та появи небажаних дописувачів.
Розв’язання даної задачі повинно здійснюватися комплексно і включати:
Література
1. Booth D., Liu C.K., SAP Labs Web Services Description Language (WSDL) Version 2.0 Part 0: Primer W3C Working Draft.
2. Carroll J., Rosson M. Better Home Shopping or New Democracy? Evaluating Community Network Outcomes. Center for Human-Computer Interaction and Department of Computer Science. 2001, 8p. http://citeseer.ist.psu.edu/470975.html
3. Deschner D., Hofmann O., Bodendorf F. Agent-Based Decentralized Coordination for Electronic Markets. HCI 2, Department of Information Systems II, University of Erlangen-Nuremberg. 1152-1156pp, 1999
4. Dieberger, Andreas. Supporting Social Navigation on the World-Wide Web, International Journal of HumanComputer Studies, Vol. 46, 1997. http://citeseer.ist.psu.edu/dieberger97supporting.html
5. Flake G. , Lawrence S., Giles C. Efficient identification of web communities. // Proceedings of the Sixth International Conference on Knowledge Discovery and Data Mining (ACM SIGKDD-2000), Boston, MA, 2000. ACM Press.
6. Flake G., Lawrence S., Giles C., Coetzee F. Self-Organization of the Web and Identification of Communities. IEEE Computer, 35(3), 66–71, 2002 http://webselforganization.com/
7. Gillet S., Kapor M. Self-govering Internet: Coordination by Design. Massachusetts Institute of Technology. Center for Coordination Science. Technical Report. 1997., 25p., http://ccs.mit.edu/CCSWP197/CCSWP197.html
8. Hendler, James, Berners-Lee, Tim and Miller, Eric. Integrating Applications on the Semantic Web. Journal of the Institute of Electrical Engineers of Japan, Vol 122(10), October, 2002, p. 676-680.
9. Miller B., Riedl J., Konstan J. Experience with GroupLens: Making Usenet Useful Again. 1997 Annual Technical Conference, January 6--10, 1997. Anaheim, CA, USA ,1997, 219-233 pp, citeseer.ist.psu.edu/miller97experiences.html
10. Miller B., Riedl J., Konstan J. Experience with GroupLens: Making Usenet Useful Again. 1997 Annual Technical Conference, January 6--10, 1997. Anaheim, CA, USA ,1997, 219-233 pp, citeseer.ist.psu.edu/miller97experiences.html
11. Pennock D., Flake G., Lawrence, Glover E., Giles C. Winners don’t take all:Characterizing the competition for links on the web. Proceedings of the National Academy of Sciences, Volume 99, Issue 8, pp. 5207–5211, April, 2002.
12. Petra S., Mark G. Virtual Communities of Transaction: The Role of Personalization in Electronic Commerce, in: Proceedings of the 12th International Bled Electronic Commerce Conference, Bled, Slovenia, 1999. 12p citeseer.ist.psu.edu/schubert99virtual.
13. Petra S., Mark G. Virtual Communities of Transaction: The Role of Personalization in Electronic Commerce, in: Proceedings of the 12th International Bled Electronic Commerce Conference, Bled, Slovenia, 1999. 12p citeseer.ist.psu.edu/schubert99virtual.html
14. Riedl M., Amant R. Social Navigation: Modeling, Simulation, and Experimentation. Computer Science Department North Carolina State University. 2002, 8p, citeseer.ist.psu.edu/471518.html
15. Riedl Mark O. A computational model and classification framework for social navigation. Intelligent User Interfaces. 137-144. 2001 http://citeseer.ist.psu.edu/mark01computational.html
16. Schubert P. The Pivotal Role of Community Building in Electronic Commerce. HICSS, 2000, 8p, citeseer.ist.psu.edu/petra00pivotal.html
17. Пелещишин А.М. Методи визначення та оптимізації тематики сайту Вісник НУ "Львівська Політехніка" №519. Інформаційні системи та мережі. 2004р. С.254-267
18. Пелещишин А.М. Методи та алгоритми моделювання Web-систем. Вісник ДУ "Львівська Політехніка", №406.-Львів, 2000. С.199-211
19. Пелещишин А.М., Гулка Т.Б. Інформаційна система аналізу діяльності Web-вузла, Вісник НУ "Львівська Політехніка" №438. Інформаційні системи та мережі. 2001р. С.115-120