Почему нужно обязательно выучить Пайтон

Python — это мощный инструмент (для дома для семьи) для автоматизации рутинных задач, особенно когда речь идет о работе с большими объемами данных. В этом посте я хочу рассказать задачку от владельца магазина на WB.

Почему нужно обязательно выучить Пайтон Python, Автоматизация, Wildberries, Маркетплейс, Обработка данных, Microsoft Excel, База данных, Программирование, Технологии, Опыт, Warner Brothers, Длиннопост

Питон - "это не только ценный мех, но и...."

При реализации проекта автоматизации по обновлению цен и остатков на маркет плейсе WB (вайлдберриз), я столкнулся с задачей: как связать базу данных артикулов продавца и поставщика, так как из общих полей было название продукта и совпадение было не полным, например: "НАД-5 STAR COSMETIC ЗУБН ПАСТ ОСНОВ НА ТРАВ С ЭКСТР НОНИ 25 гр-3 шт" и "5 STAR COSMETIC ЗУБНАЯ ПАСТА ОСНОВ НА ТРАВАХ С ЭКСТРАКТОМ НОНИ 25,0". В прайсе поставщика 30 тыс. артикулов, а у продавца 5.5 тыс. позиций и в ручную связывать артикулы это... И тут на сцену выходит Пайтон!

Представьте, что у вас есть два файла Excel: seller.xlsx и supplier.xlsx. В первом файле есть пустой столбец "Наименование поставщика", который необходимо заполнить значениями из столбца "Название" второго файла. Задача усложняется тем, что нужно найти максимально совпадающие значения по последовательности букв из столбца "Артикул продавца" в файле seller.xlsx. Поскольку позиций более 30 тысяч, важно максимально эффективно использовать оперативную память и многопоточность.

Бонусом, для менеджера магазина, стал файл эксель в котором можно использовать функцию ВПР, для автоматического проставления цен из прайса поставщика.

upd: немного кода

Почему нужно обязательно выучить Пайтон Python, Автоматизация, Wildberries, Маркетплейс, Обработка данных, Microsoft Excel, База данных, Программирование, Технологии, Опыт, Warner Brothers, Длиннопост

Код оптимизирован для выполнения несколькими потоками с помощью ProcessPoolExecutor, что позволяет параллельно обрабатывать строки и существенно снижает время выполнения задачи.

Мои сети - https://t.me/apicraft, https://www.youtube.com/@jspytop, http://apicraft.ru/

Вы смотрите срез комментариев. Показать все
0
DELETED
Автор поста оценил этот комментарий

Чем пайтон для этой задачи лучше любого другого ЯП?

раскрыть ветку (6)
0
Автор поста оценил этот комментарий

Наличием библиотек для обработки данных и файлов

раскрыть ветку (5)
0
DELETED
Автор поста оценил этот комментарий

Простите, среди топ-20 яп есть хоть один, который не может обрабатывать данные и файлы? Не берем во внимание что-то типа sql.

раскрыть ветку (4)
0
Автор поста оценил этот комментарий

Опять же поддержка языка в gpt, попробовал перенести на rust (я его не знаю) - одни ошибки при компиляции. Опять же кросс платформенность тоже большой плюс для js, python

раскрыть ветку (2)
0
DELETED
Автор поста оценил этот комментарий

java, php, с++ обладают такими же свойствами.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Тут уж каким инструментом владеешь тем и пользуешься. Для моих задач питона и js за глаза, их бы хорошо "выучить"

0
Автор поста оценил этот комментарий

Хороший вопрос, но инструментарий (надо не только файл "открыть" но и подходящий алгоритм обработки выбрать) у питона как правило самый разнообразный и если время не имеет решающего значения - питон надёжнее. А так было-бы интересно сравнить в похожей задаче с rust и go...

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку