Собственный поисковик: База Данных

Урок создания поисковика – часть 3 «База данных». В этом уроке мы рассмотрим базу данных нашего поисковикаУрок создания собственного поисковика»).

Как сделать поисковик?
Как сделать базу для поисковика на MySQL?
Поиск по базе MySQL?

Индекс хранит в себе всю информацию о страницах, сайтах проиндексированных поисковым роботом. Именно в эту базу данных импортируется файл base.txt созданный поисковым роботом.

Создание базы данных для поисковика

Доступ к базам данных MySQL осуществляется с помощью PhpMyAdmin.
Но прежде чем импортировать что-либо надо создать базу данных и ее таблицы.
Для того чтобы создать базу MySQL необходимо открыть PhpMyAdmin в браузере (если в качестве сервера используется собственный компьютер с установленным третим денвером, то в строку адреса вводится http://localhost/tools/phpmyadmin/), ввести название базы в поле Создать новую БД, даем имя poisk, из выпадающего меню выбираете cp1251_general_ci и нажимаете на кнопку создать. Наша база poisk создалась. Далее необходимо создать две таблицы base и urls. В поле Создать новую таблицу в БД poisk: в качестве имени пишите base, количество полей: 5, нажимаете на кнопку Пошел, потом откроется следующая страница в котором надо ввести атрибуты полей (см. ниже на таблицу).

Поле Тип Длины/значения Сравнение Дополнительно первичный
id int 11 Auto_increment .
title varchar 255 cp1251_general_ci
description varchar 255 cp1251_general_ci
keywords varchar 255 cp1251_general_ci
url varchar 255 cp1251_general_ci

Вторая таблица создается также, только вместо имени задается urls и 3 поля, используются следующие атрибуты.

Поле Тип Длины/значения По умолчанию Дополнительно Первичный
Id Int 6 Auto_increment .
url Varchar 255
Indexed Int 1 0

Пояснение таблицы base:
Главная таблица по которой будут воспроизведен поиск из веб интерфейса нашего поисковика, в эту базу импортируется тот самый файл который экспортировал поисковый робот, файл base.txt.
Id– уникальный идентификатор, auto_increment для того чтобы ввелся автоматически счет;
title– заголовок страницы;
description – описание страницы;
keywords – ключевые слова;
url – URL адрес страницы.

Поиск будет ввестись по полям: title, description, keywords, url, поэтому им присваивается сравнение: cp1251_general_ci, для поиска без учета регистра.
Пояснение таблицы urls:
Хранит список URL адресов которые ввели в веб интерфейсе для индексирования. В последующем через php скрипт из него экспортируем URL адреса для импорта в поисковый робот, в текстовый файл urls.txt.
Id– уникальный идентификатор, auto_increment для того чтобы ввелся автоматически счет;
url – URL адрес страницы
Indexed – для определения проиндексирована ли страница, 1 – Да, 0 – Нет.

Для того чтобы к базе имели доступ только определенные пользователи надо создать этого пользователя. Для того чтобы создает его, справа в выпадающем меню выбираете первое «(Базы Данных)…», нажимаете по ссылке «Привилегии», «Создать нового пользователя», лучше дать ему все права и удалить остальных «без парольных» пользователей во избежание недоброжелателей, которые с радостью уничтожат вашу базу.

]]>

Добавить в закладки

]]>

Теги: ,

2 комментариев по “Собственный поисковик: База Данных”

  1. ]]> Собственный поисковик: Поисковый робот ]]> сказал:
    июля 18, 2009 в 19:56

    [...] данные о проиндексированных страницах в нашу базу данных. как сделать поисковик? как сделать поисковый робот, [...]

  2. ]]> ]]> сказал:
    июля 20, 2009 в 17:13

    Super!Всё очень Интересно!

Оставьте комментарий: