Направо към съдържанието

Уикипедия:Брояч/Промени

от Уикипедия, свободната енциклопедия
Архив Тази страница от именно пространство „Уикипедия“ е вече стара и неактуална. Съдържанието ѝ се пази от исторически интерес; моля, не го редактирайте! Прегледайте настоящата ѝ версия (ако има такава) или инициирайте обсъждане за актуализация.

Последната версия на базата с данни е компресирана и качена тук (10:16, 13 апр 2005 (UTC)). Това са предишните записи (преди промените в таблиците) и текущите (от вчера-онзи ден). В момента предишните записи са изтрити от базата. Би ни отнело доста усилия да ги преместим, а за 5 дни може би не си струва (но данните са архивирани, за случай на нужда).

Текущото копие на базата, всички таблици, само данните: 16:26, 27 апр 2005 (UTC), SQL dump, 1,3 MB.

Ново текущо копие на базата, всички таблици, само данните (базата е малко променена, схемата е в архива със скрипта): 22:20, 30 апр 2005 (UTC), SQL dump, 652 kB.

Ново текущо копие на базата 11:25, 28 май 2005 (UTC) 710К

Текущо положение 10 април 2005 (ден 10)

В петък пратих писмо на автора и основен разработчик Цветозар Драмбозов с промените, които сме направили досега.

Качих току що един SQL-dump() от цялата ни база с данни: тук, за разучаване и анализ (ако не знаете дали ви трябва, вероятно не ви трябва). Ето няколко наблюдения. В момента (23:15, 10 апр 2005 (UTC)) имаме общо 34822 записа за около 9,3 МБ при ежедневно оптимизирани таблици, което прави средно по два мегабайта на ден (основната "тежест" е Уикипедия, която е само на 4 пълни дни). Имаме крещяща нужда да променим записа на информацията към това, което ни е наистина полезно, защото наистина има тенденция към безгранично увеличение. Таблиците с най-много записи са външните препратки и локалните страници.

  • От външните препратки доста голям брой идват от други уикипедии или уикицитати (най-голям брой от МЕП), останалите от търсачки. Тази таблица просто ще продължи да се уголемява, ако не вземем някакво решение.
  • За локалните страници има две тенденции: регистрираните потребители използваме много повече различните функции като редактиране, предв.преглед, история, разлики, приноси и др., като тези различни варианти имат безкрайно много комбинации и също ще се увеличават; регистрирани и нерегистрирани уикипедианци разглеждаме нормалните, последни версии на статиите, тенденцията при тези записи е бързо достигане на общия брой статии (х2) и след това - към стабилизиране и бавно увеличаване.

Затова възнамерявам скоро да направя следните промени:

  • Външните МЕП от други Уикипроекти да се групират по сървър и само това да се отчита. Имам чувството, че такава статистика е интересна, а отброяването на всяка МЕП по отделно - не чак толкова (примерно, че 1 човек общо е дошъл от es:Isabel II del Reino Unido). Направено. 11:44, 11 апр 2005 (UTC)
  • Да не се отброяват страници с различните функции (ред., ист., разл...) поотделно, ами накуп (като /w/index.php). Тези страници досега бяха в различни записи, но наистина броят на комбинациите е неограничен, а ползата да се отчитат - за мен поне - не е очевидна. (това вече е променено)
  • Да се обединят регистрираните с нерегистрираните потребители в една таблица - така най-голямата ни таблица с локални страници ще се намали почти наполовина (вече съм го споменал, трябва да се добави една колонка и няколко реда код). В процес на тестване 11:44, 11 апр 2005 (UTC)
  • Постепенно да се правят гореизброените "желания за промени".

Ако имате въпроси и предложения, или идея за ново свойство или за запазване на старо, нов вид статистика или каквото и да е, свиркайте - почти всичко е възможно да се направи и всичко може да се възвърне. --5ko | Беседа 23:15, 10 апр 2005 (UTC)

Желания за промени

Опимизирането на таблиците би ни спестило и дисково пространство, и време за обработка (CPU), затова е един от приоритетите ни.

Обединяване на таблиците на регистрирани и нерегистрирани потребители за даден проект Направено.
Единствената промяна е добавяне на една колонка в таблицата "phpcounter_localpage" и малко програмен код. Останалите отчетни параметри не са от огромно значение, а това би намалило на половина размерите на най-голямата таблица.
Добавяне на дневен и/или седмичен брояч за всяка посетена страница Направено.
Трябва да се добавят още три цифрови колонки в таблицата "phpcounter_localpage" и няколко реда код. В страницата ще се показват:
входящи анонимни | общо анонимни | общо регистрирани | общо всички | днес всички | тази седмица всички
Това ще ни помогне да следим по кое време на годината какви страници се търсят, примерно сезонните, мартенички, Великден, Коледа, личности (около рожденните им дни) и т.н. Броячи "днес" и "тази седмица" се анулират съответно ежедневно или седмично, затова можем да ги отбелязваме по някакъв начин.
Възможност за сортиране на тези статистики по различните колонки
(не е спешно) За това ще трябва да се пише доста код.
Добавяне на система с подложки (template) за отделяне на кода от дизайна
И за това ще падне писане, обаче после ще е много по-лесно да се правят подобрения.
Статистика по ключови думи на търсачки (подобно на extremetracking.com) Направено, но може да се подобри.
(не е спешно) Заради търсачките, таблицата с външните препратки има тенденция към неограничен растеж, вероятно е добре да помислим за по-удобен начин на складиране и преглед на такава информация.

Промени

Последната версия на всички променени файлове се намира тук (23:07, 5 май 2005 (UTC)).

  • Малко разместване в get_keyword() за скорост --5ko | Беседа 10:27, 8 апр 2005 (UTC)
  • Добавяне най-долу на "Powered by...". --5ko | Беседа 10:44, 8 апр 2005 (UTC)
  • Направих промени по таблиците и добавих код за обединяване на таблиците регистрирани/гости в една. Засега изглежда да работи. Включен е еднствено за Уикипедия, в нова (празна) таблица. Ако видим, че няма особени грешки, ще пренесем данните от предишните дни в новата. --5ko | Беседа 11:20, 11 апр 2005 (UTC)
  • Препратките от МЕП вече не се отчитат всяка поотделно, ами всеки сървър поотделно. (в процес на тестване) --5ko | Беседа 11:44, 11 апр 2005 (UTC)
  • Направих известни промени, така че в момента локалните страници имат дневен и седмичен брояч. В момента страниците са сортирани по дневни, седмични и общо посещения, като работя по възможност да се избере сортирането с препратка от HTML-таблицата. --5ko | Беседа 11:37, 13 апр 2005 (UTC)
  • Добавих тестов код за отбелязване на търсенията от Специални:Search, ще го видим доколко работи... (търсенията се показват по този начин: // ?:прелетни птици) :) --5ko | Беседа 12:00, 13 апр 2005 (UTC)
  • Локалните търсения се показват в отделна табличка, освен в основната на локалните страници (тъй като тези търсения са единични, така по-лесно се откриват. --5ko | Беседа 09:42, 14 апр 2005 (UTC)
  • Забелязах, че препратките от start.bg са единствено от под-домейни, затова ги премахнах от таблицата с препращащи страници: те така и така се отбелязват в таблицата с домейните. --5ko | Беседа 10:59, 18 апр 2005 (UTC)
  • Външните препратки и търсачки също се сдобиха с дневен и седмичен брояч и са подредени по дневни, седмични, общо посетители. Това ще ни помогне веднага да откриваме ако някъде сложат нова статия/препратка към нас и ако се наложи, да можем да реагираме. Разбира се, като го допиша, ще може да се избира и подреждане по другите критерии. --5ko | Беседа
  • Преорганизация на таблицата с локални страници, макар че външно не се забелязва без телескоп. В момента в тази таблица се записват само реалните локални страници, по-точно само заглавията на кирилица, без http://bg.wiki*.org/wiki/%D0%9F%D0%BE%D1%82%D1%80%D0%B5%D0%B1%D0%B8. Това от една страна намали тази таблица от 9 на 3 мегабайта, от друга ще даде възможност примерно за търсене измежду резултатите (в далечното бъдеще). --5ko | Беседа 00:40, 30 апр 2005 (UTC)
  • Добавен е код за отбелязване на най-посещаваните страници за всеки ден и за всяка седмица (по 5, но може да се промени броя), като не се броят няколко, и по-точно 'Начална страница', 'Съдържание', '%:Портал', '%:Помощ', '%:Търсене', 'Специални:%', '%:Пясъчник', '%:Съдържание' (знакът % означава 'каквото и да е') - тези страници ми се струват по-малко интересни. Резултатите се записват в седмични файлове за всеки проект и се намират на адрес /wikitext/ (текущите са само за проба, от утре почват да се попълват наистина). Актуализацията е в полунощ по CET, тоест в момента UTC+2 часа. Тези странички са готови за слагане в някоя Уики:Статия, на който му се занимава. Има готов код тези неща да се попълват и в базата с данни, но като уикитекст като че е по-просто и засега съм ги откоментирал. Всичко е в процес на тестване де, дано да не се появят бъгове. --5ko | Беседа 02:40, 30 апр 2005 (UTC)
  • По предложението на Спас (чак сега го схванах) препратките за локалните търсения са с "&go=..." - така веднага се разбира дали вече съществува такава страница. --5ko | Беседа 12:05, 30 апр 2005 (UTC)
  • Таблицата с външните препратки е разделена на две. Една нова таблица, в която има само ключови думи от търсачки, заедно с техния дневен, седмичен и общ брояч. Другите препратки, които са основно от сайтове, форуми, топ-списъци, статии и блогове, ще си останат в сегашната таблица. --5ko | Беседа 22:18, 30 апр 2005 (UTC)
  • От сега нататък колонките "днес", "седмица", "общо" отброяват само гостите на Уики-проектите, тоест нерегистрираните потребители. Също така са променени дневните и седмични статистики, и те показват само гостите. Седмичните най-посещавани страници са увеличени на 10, дневните ключовите думи - също на 10, а седмичните - на 20. Някои други дребни промени. Заб. Резултатите от тези промени (ако проработят) ще ги получим чак утре в полунощ, не сега след малко. --5ko | Беседа 20:27, 3 май 2005 (UTC)
  • Файл inc.php: ред 104 променен към: foreach($ignore_keywords as $v) $Kignored .= " AND keyword NOT LIKE '$v' "; и архивът не е актуализиран. --5ko | Беседа 02:55, 4 май 2005 (UTC)
  • Още няколко дребни промени във функцията daily_count(). Архивът е актуализиран. --5ko | Беседа 15:24, 5 май 2005 (UTC)
  • На два пъти се случва най-посещаваните страници от деня да се запишат неколкократно (4 и 5 пъти) във всеки файл, а аз не успях да възпроизведа същата грешка. Предполагам, причината е, че е имало точно в полунощ няколко почти едновременни посещения. Добавих допълнителна проверка със заключващ файл, ще видим дали ще свърши работа. --5ko | Беседа 23:07, 5 май 2005 (UTC)