DeepSeek написал ИИ-агент на языке Python, который получает дамп «Рувики» в формате XML и извлекает из него вики-разметку статей. Затем он преобразует специальные символы разметки в теги HTML: заголовки, жирный шрифт, ссылки и списки. Параллельно агент подключает CSS-стили для оформления. На выходе формируется готовый HTML файл с сохранением структуры и гиперссылок. Весь процесс автоматизирован, что позволяет быстро конвертировать тысячи энциклопедических статей в HTML формат без ручной вёрстки:
Также DeepSeek генерирует каталожные страницы, каждая из которых может содержать, например, 20 биологических видов:
Вот результат на главной странице сайта https://tablepedia.com/
Главная страница сайта tablepedia.com
Напишите, пожалуйста, пожелания и предложения по улучшению сайта. Также будет неплохо, если вы напишете адреса электронных энциклопедий, которые содержат каталоги статей по определённой теме (вроде вышеупомянутых млекопитающих).

Искусственный интеллект
5.7K постов11.9K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан