Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр У самурая нет цели — есть лишь путь. Долгий и бесконечный. С каждым шагом, оттачивая мастерство, он движется всё дальше вперёд.

Долгий путь: idle

Кликер, Ролевые, Фэнтези

Играть

Топ прошлой недели

  • solenakrivetka solenakrivetka 7 постов
  • Animalrescueed Animalrescueed 53 поста
  • ia.panorama ia.panorama 12 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
11
TechSavvyZone
TechSavvyZone

Технологии: "Alpha" история в фактах и комментариях⁠⁠2

2 месяца назад

Вступление

Данный труд открывает цикл статей, посвящённых процессорам и архитектуре Alpha, а также многому с ними связанному. Цикл, потому что изложение всего имеющегося материала в виде одного обзора показалось автору довольно проблематичным и неуместным. К тому же, открываемая тема является действительно многогранной и во многих аспектах фундаментальной, не имеющей прецедентов в плане полноты и масштабности изложения, поэтому вполне заслуживает пристального и подробного рассмотрения. Возможно, эта и последующие статьи смотрелись бы более уместно лет 5 назад, когда Alpha-процессоры ставили очередные рекорды производительности и масштабируемости, a их будущее ожидалось совсем не таким, каким оно выглядит с точки зрения дня сегодняшнего. Однако, именно в наше время можно уверенно подвести финальную черту под этой сагой, посвященной одной из самых интересных и перспективных компьютерных архитектур.

Эта статья является, в значительной мере, историческим очерком с элементами анализа, поэтому её следует рассматривать именно в этом аспекте. В целом, она не претендует на универсальность, хотя и содержит значительное количество справочной информации. С другой стороны, рассматривать её как некролог или надгробную молитву также явно не стоит...

Часть 1. PDP и VAX


Digital Equipment Corporation (сокращенно DEC), основанная в 1957 двумя инженерами, Кеннетом Ольсеном (Kenneth Olsen) и Харланом Андерсоном (Harlan Anderson), выпускниками Массачусетского технологического института, была одной из старейших и наиболее значимых компаний мировой компьютерной индустрии.

До основания компании, Ольсен работал в Линкольнской лаборатории при том же институте, содержащейся на средства Министерства обороны США, и участвовал в разработке одного из первых транзисторных компьютеров, TX-2. Первое время компания разрабатывала и продавала элементарные модули для вычислительной техники, но уже в 1960 представила свой первый компьютер, 18-битный PDP-1 (Programmable Data Processor - 1), способный производить около 100 тыс. операций в секунду; кроме всего прочего, именно на нем была написана первая в истории компьютерная игра, Spacewar Стивена Рассела (Steven Russell). 12-битный PDP-8, запущенный в производство в 1964, вполне заслуженно считают первым серийно выпускаемым "миникомпьютером", из-за довольно компактных размеров (с небольшой шкаф) и невысокой, по тем временам, цены (около 18 тыс. долл. США (1965) в базовой комплектации); благодаря отличному соотношению цены и производительности, этот компьютер смог составить достойную конкуренцию знаменитым мэйнфрэймам IBM, и к 1968 было собрано около 1450 машин (не считая поздних многочисленных модификаций). В том же 1968 был представлен 36-битный PDP-10, основанный на дизайне экспериментального PDP-6, рассчитанный на использование в центрах обработки данных, исследовательских лабораториях, и в военных целях; модификации PDP-10 производились вплоть до 1983. Работы над усовершенствованием 36-битной архитектуры продолжались в рамках проекта "Единорог" (the Unicorn project), под руководством Леонарда Хьюджеса (Leonard Hughes) и Дэвида Роджерса (David Rogers), но в июне 1975 проект был закрыт, и все ресурсы были переведены на поддержку другой, 32-битной, архитектуры.

16-битный PDP-11, запущенный в производство в начале 1970-х, был первым компьютером DEC, в котором использовались 8-битные байты, и прямым наследником линейки PDP-8. Благодаря простой и удачной архитектуре, основанной на системной шине Unibus (или её модификации, Q-bus), довольно эффективному набору инструкций, и, что немаловажно, невысокой стоимости, линейка PDP-11 очень быстро обрела популярность. Вполне закономерно, что PDP-11 вскоре стали широко клонировать, в том числе и в "странах народной демократии": СМ-4 (СССР, Болгария, Венгрия), СМ-1420 (СССР, Болгария, ГДР), СМ-1600 (СССР), ИЗОТ-1016 (Болгария), ДВК (СССР). Для PDP-11 было разработано множество операционных систем: DEC предлагала P/OS, RSX-11, RT-11, RSTS/E, также было доступно несколько вариантов DOS, и в конце-концов, на PDP-7 и PDP-11 в 1971 было сделано первое издание ОС UNIX (в Bell Laboratories), тогда ещё на ассемблере. PDP-11 ушел с рынка в течение 1980-х по одной, но неизбежной причине: недостаточный объем адресного пространства, знаменовавший переход на новую, 32-битную, но все ещё CISC, архитектуру.

И ей стала VAX (Virtual Address eXtension), официально утвержденная на заседании VAX Architecture Committee в апреле 1975. Детали архитектуры разрабатывались в течение нескольких месяцев в рамках проекта "Звезда" (the Star project) под руководством Гордона Белла (Gordon Bell), параллельно с вышеупомянутым проектом "Единорог", и по окончании работ над обоими проектами было решено отменить дальнейшее развитие 36-битных систем, и сконцентрировать ресурсы на поддержке 32-битных VAX'ов. Фактическим результатом работы проекта "Звезда" было обоснование необходимости как увеличения разрядности основных регистров PDP-11 до 32 бит, так и их числа (с 8 до 16), а также существенный пересмотр набора инструкций. В октябре 1977 был анонсирован первый представитель линейки -- модель 11/780, а в феврале 1978 была выпущена новая операционная система для VAX'ов, VMS (Virtual Memory System) версии 1.0; к слову, новая ОС, многопользовательская и многозадачная, поддерживала до 64Мб оперативной памяти, встроенные сетевые возможности (DECnet), адаптивный планировщик задач, расширенное управление процессами, и многие другие функции, значительно опередившие свое время. В апреле 1980 вышла версия 2.0, с многочисленными улучшениями, переименованная в VAX/VMS. На VAX также была вскоре портирована классическая UNIX. VAX'ы выпускались и продавались с большим успехом в течение 1980-х, и даже на рубеже веков поставлялись ограниченными партиями по спецзаказам. Модельный ряд насчитывал несколько десятков наименований: от довольно компактных рабочих станций до 6-процессорных серверов мэйнфрэйм-класса. И по сей день тысячи VAX'ов работают в структуре Министерства обороны США и NSA (National Security Agency), а также во многих коммерческих организациях. Но тем не менее, эпоха VAX'ов осталась в 1980-х, а в 1990-х DEC сделала ставку на новую архитектуру.

Часть 2. Проект PRISM


В начале 1980-х DEC была на вершине финансового могущества, в значительной мере благодаря стабильно растущим объемам поставок VAX'ов. Однако ничто не вечно, и было очевидно, что в своё время и VAX придется уйти с рынка, как это уже происходило с PDP-11. В то время многие компании начали обращать внимание на перспективные разработки в среде RISC, и DEC явно не желала остаться в стороне. С 1982 по 1985 в составе компании активно работали несколько подразделений, занимавшихся исследованиями в области RISC:


Titan, высокоскоростной дизайн от Западной исследовательской лаборатории (Western Research Laboratory, DECwest) в Пало-Альто (Калифорния), под руководством Фореста Бэскетта (Forest Baskett), с 1982;
SAFE (Streamline Architecture for Fast Execution), под руководством Алана Котока (Alan Kotok) и Дэвида Орбица (David Orbits), с 1983;
HR-32 (Hudson RISC 32-bit), при фабрике DEC в Хадсоне (Массачусетс), под руководством Ричарда Витека (Richard Witek) и Дэниела Добберпуля (Daniel Dobberpuhl), с 1984;
CASCADE Дэвида Катлера (David Cutler) в Сиэттле (Вашингтон), с 1984.


В 1985, с подачи Катлера насчёт создания "корпоративного RISC-плана", все 4 проекта были объединены в один,PRISM(Parallel Instruction Set Machine), и совместными усилиями к августу 1985 была подготовлена первая спецификация на новый RISC-процессор. Стоит упомянуть, что к тому времени DEC уже принималa активное участие в разработке процессора MIPS R3000 и даже инициировалa создание консорциума Advanced Computing Environment для продвижения этой архитектуры на рынке.

Поэтому нет ничего удивительного в том, что разрабатываемый процессор унаследовал много черт, присущих архитектуре MIPS, но в то же время отличия были очевидны. Все инструкции имели фиксированную длину в 32 бита, из них верхние 6 и нижние 5 были собственно кодом инструкции, а остальные 21 предназначались для непосредственно данных либо их адресации. Были определены 64 основных 32-битных целочисленных регистрa (MIPS предусматривалa 32), а также 16 дополнительных 64-битных векторных регистров, и 3 контрольных регистра для векторных операций: два 7-битных (vector length и vector count), один 64-битный (vector mask). Регистр состояния процессора отсутствовал, поэтому результат сравнения двух скалярных операндов помещался в целочисленный регистр, а результат сравнения двух векторных операндов -- в vector mask. Встроенный блок вычислений с плавающей запятой не предусматривался. Также присутствовал набор специальных инструкций(Epicode, или extended processor instruction code), реализованных программно посредством загружаемого микрокода, для облегчения решения специальных задач, присущих определённой среде или операционной системе, и не предусмотренных стандартным набором команд; впоследствии, эта функция была реализована в архитектуре Alpha под названиемPALcode(Privileged Architecture Library code).

К 1988 проект был всё ещё в стадии разработки, когда высший менеджмент DEC закрыл его, посчитав дальнейшее финансирование нецелесообразным. Протестуя против этого, Катлер уволился и ушёл в Microsoft, где возглавил подразделение по разработке Windows NT.

В начале 1989 DEC представила свои первые рабочие станции с RISC-процессорами, DECstation 3100 на основе 32-битногоMIPS R2000с частотой в 16МГц, и DECstation 2100 на основе того же процессора, но с частотой в 12МГц. Обе машины работали под ОС Ultrix и стоили довольно умеренно (около 8 тыс. долл. США (1990) за DECstation 2100).

Часть 3. Проект Alpha


В 1989 морально стареющая архитектура VAX уже с трудом могла конкурировать с RISC-архитектурами 2-го поколения, такими какMIPSиSPARC, и было вполне очевидно, что следующее поколение RISC оставит VAX немного шансов на выживание. В середине 1989 перед инженерами DEC была поставлена задача создания конкурентоспособной RISC-архитектуры с перспективным потенциалом, но минимально несовместимой с VAX, чтобы облегчить перенос на неё VAX/VMS и всей сопутствующей программной базы. Также было определено, что новая архитектура должна изначально быть 64-битной, так как конкуренты уже были в процессе перехода на 64 бита. Была создана рабочая группа, в которой главными архитекторами были Ричард Витек и Ричард Сайтс (Richard Sites).

Первое официальное упоминание об архитектуреAlphaдатируется 25 февраля 1992, на конференции в Токио. Одновременно в небольшом обзоре (для USENET-конференции comp.arch) были перечислены ключевые моменты новой архитектуры; там же было оговорено, что "Alpha" является кодовым именем нового процессора, а рыночное название будет представлено позже. Процессор имел чистую64-битнуюRISC-архитектурус инструкциями фиксированной длины(по 32 бита),с 32 целочисленными64-битными регистрами, работал с 43-битными адресами виртуальной памяти (с расширением до 64 бит в перспективе), использовал, как и VAX,little-endianпорядок следования байт (то есть, когда младший байт регистра занимает при записи младший адрес в памяти; традиционно поддерживался Intel, в противовес к big-endian, изначально внедрённому Motorola, и используемому в большинстве процессорных архитектур, где младший байт регистра занимает при записи старший адрес в памяти). Математический сопроцессор был изначально интегрирован в ядро, вместе с 32 вещественными64-битными регистрами, причём использовался произвольный доступ к ним, в отличие от примитивного стекового, используемого сопроцессорами Intel x87. Срок службы новой архитектуры был определен, как минимум, в 25 лет.

Поддерживаемый набор инструкций был максимально упрощён с целью максимального облегчения конвейеризации, и состоял из 5 групп:


инструкции для целочисленных вычислений;
инструкции для вещественных (с плавающей запятой) вычислений;
инструкции отработки условных и безусловных переходов, а также сравнения;
инструкции загрузки и сохранения данных;
инструкции PALcode.


Стоит отметить, что инструкции целочисленного деления отсутствовали, так как являлись наиболее сложными и плохо поддающимися конвейеризации, а поэтому эмулировались.

Архитектура Alpha была "настоящей" RISC (в отличие от современных процессоров архитектуры i386, которые RISC только изнутри). Концептуально разница междуRISC(Reduced Instruction Set Computing) иCISC(Complex Instruction Set Computing) состояла (и до сих пор состоит) в нескольких моментах:

Процессор предполагалось запустить в производство на очень высокой для того времени частоте - 150МГц, и довести до 200МГц при тех же конструкторских нормах. Это оказалось возможным как благодаря удачной архитектуре, так и благодаря отказу разработчиков от использования систем автоматического проектирования и выполнению всех работ по схемотехнике исключительно вручную.

Проект вступил в производственную стадию и вскоре был реорганизован в регулярное подразделение DEC.

Трудами отдела маркетинга DEC новая архитектура получила название AXP (или Alpha AXP), хотя до сих пор неизвестно, аббревиатурой чего было это недоразумение. Возможно, что и ничего; в прошлом DEC имела проблемы с торговой маркой VAX, на которую претендовала компания по производству пылесосов, и тогда дело дошло до суда. Кроме всего прочего мотивировалось, что рекламный слоган этой компании ("Nothing sucks like a Vax!" - "Ничто не сосёт так, как Vax!") дискредитирует продукцию DEC. Так что вскоре в компьютерном мире появилась шутка, что AXP - это "Almost Exactly PRISM", то есть "почти точно PRISM".

Часть 4. EV4, LCA4, EV45, LCA45


Первый процессор из семейства Alpha получил название 21064 (21 указывал, что Alpha -- это архитектура XXI века, 0 -- процессорное поколение, 64 -- разрядность в битах), и кодовое наименование EV4 (EV является [предположительно] аббревиатурой "Extended VAX", а цифра 4 -- поколением техпроцесса, CMOS4; CMOS, в свою очередь, есть аббревиатура "Complementary Metal Oxide Semiconductor"). Стоит отметить, что прототип EV4 был готов ещё в 1991, по CMOS3 техпроцессу, а поэтому с уменьшенными кэшами и без блока вычислений с плавающей запятой; тем не менее, он сыграл свою роль в отладке архитектуры и программной среды. EV4 был представлен в ноябре 1992, и поступил в производство на передовом для того времени 3-слойном 0,75µ техпроцессе (впоследствии, производство было переведено на оптическую модификацию CMOS4 -- CMOS4S, 0,675µ). Был рассчитан на напряжение питания в 3,3В, выпускался с тактовыми частотами от 150МГц до 200МГц (ТDP от 21Вт до 27Вт). Состоял из 1,68 млн. транзисторов, и имел площадь ядра в 233 кв. мм. Поддерживал многопроцессорность, как один из ключевых моментов архитектуры. Форм-фактор: PGA-431 (Pin Grid Array).

Кэш L1 был интегрирован: 8Кб для инструкций (I-cache, instruction cache), с прямым отображением (direct-mapped), а также 8Кб для данных (D-cache, data cache), с прямым отображением и сквозной записью (write-through). Задержки при чтении из D-cache составляли 3 такта. Каждая линия I-cache состояла из 32 байт инструкций, 21-битного тега, 8-битного поля истории переходов, и нескольких вспомогательных полей; каждая линия D-cache состояла из 32 байт данных и 21-битного тега. Кэш L2 (B-cache, backup cache) был рекомендуемой опцией, набирался на микросхемах синхронной или асинхронной статической памяти, работал в режиме обратной записи (write-back) с прямым отображением и упреждающим чтением (read-ahead), мог иметь размер до 16Мб (обычно от 512Кб до 2Мб); каждая линия состояла из 32 байт данных или инструкций с 1-битным long-word parity или 7-битным long-word ECC, максимум 17-битного тега с 1 битом чётности, и 3 битов состояния с 1 битом четности. Скорость чтения/записи B-cache программировалась, в тактах процессора. Разрядность системной шины данных составляла 64 или 128 бит (программируемо, с 1-битным long-word parity или 7-битным long-word ECC), и она мультиплексировалась с шиной данных B-cache, переключаясь при необходимости; разрядность системной шины адреса составляла 34 бита. Организационно B-cache был включающим (inclusive) D-cache, то есть поддерживал копию содержимого последнего. При выгрузке данных из B-cache в память использовался механизм victim write. Операции чтения/записи в B-cache являлись прерогативой исключительно процессора, для системной логики было разрешено только чтение файла тегов (B-tag, что жизненно необходимо особенно в многопроцессорных системах, для обеспечения согласованности (когерентности) кэшей).

Процессор имел один целочисленный конвейер (E-box, 7 стадий), и один вещественный конвейер (F-box, 10 стадий). Декодер и планировщик инструкций (I-box) был в состоянии подавать 2 команды за такт в порядке очереди (in-order) на исполняющие устройства, то есть на E-box, F-box и блок загрузки/сохранения (A-box). Контроллер кэшей и системной шины (C-box) работал в тесном взаимодействии с A-box и управлял как интегрированными I-cache и D-cache, так и внешним B-cache. Также присутствовал блок предсказания переходов (branch prediction unit), с таблицей переходов на 4096 записей (branch history table), по 2 бита каждая. I-TLB имел 8 записей для 8Кб-страниц, и 4 записи для 4Мб-страниц, все с пoлной ассоциативностью (fully-associative). D-TLB имел 32 записи, с полной ассоциативностью.

Несмотря на отличную производительность, EV4 был довольно дорог для значительной части потенциальных покупателей, и поэтому в сентябре 1993 был анонсирован его бюджетный собрат, 21066 (LCA4, или LCA4S). Этот процессор был основан на ядре 21064, но с дополнительно интегрированными контроллерами памяти и шины PCI, а также некоторыми второстепенными функциями. Однако, разрядность системной шины данных была урезана до 64 бит, что негативно сказалось на производительности. LCA4 производился по 0,675µ CMOS4S техпроцессу, и его площадь оказалась ещё меньше, чем у EV4 (209 кв.мм по сравнению с 234 кв.мм.), а тактовые частоты были занижены (от 100МГц до 166МГц), в значительной мере из-за потенциальной угрозы перегрева в плохо вентилируемых настольных системных блоках того времени, и чтобы не создавать дополнительной конкуренции EV4. Количество транзисторов в ядре составило 1,75 млн., a напряжение питания -- 3,3В. Дизайн этого процессора был лицензирован Mitsubishi, и последняя также производила LCA4 (включая и 200МГц версию).

В октябре 1993, на Microprocessor Forum, был анонсирован 21064А (EV45), обновленная версия EV4, производимая по 4-слойному 0,5µ CMOS5 техпроцессу. В ноябре 1994, на COMDEX'94, был представлен 21066А (LCA45), почти аналогично модифицированная версия LCA4. Стоит отметить, что манера маркетологов DEC добавлять букву к модели процессора при перепланировке ядра под новый техпроцесс сохранилась и в будущем. Собственно состав процессорных ядер изменился незначительно; EV45 теперь обладал удвоенным размером кэша L1 (16Кб I-cache + 16Кб D-cache), к полям данных и тегам I-cache и D-cache было добавлено по биту чётности, поля истории переходов I-cache были расширены до 16 бит, ассоциативность D-cache была увеличена до 2 (2-way set associative), а к режимам контроля над системной шиной данных был добавлен 1-битный byte parity. Также в EV45 и LCA45 был незначительно модифицирован F-box (оптимизация деления: в EV4 одна операция требовала 34 такта для операндов одинарной точности и 63 такта для операндов двойной точности, вне зависимости от значений операндов; в EV45 она уже требовала от 19 до 34 тактов для операндов одинарной точности и от 29 до 63 тактов для операндов двойной точности, в зависимости от значений операндов). LCA45 также производился на мощностях Mitsubishi. Площади ядер уменьшились: до 164 кв.мм (EV45) и до 161 кв.мм (LCA45), количество транзисторов в ядре EV45 возросло до 2,85 млн., а в ядре LCA45 осталось прежним (1,75 млн.). В конечном результате, энергопотребление обоих процессоров в расчёте на единицу частоты сократилось, хотя напряжение питания осталось неизменным (3,3В). Тактовые частоты ЕV45 составляли от 200МГц до 300МГц (TDP от 24Вт до 36Вт), LCA45 -- от 166 до 233МГц.

Так как DEC участвовала в разработках оборудования под заказ Министерства обороны США, то в 1994 были спроектированы процессоры 21068 (66МГц) и 21068А (100МГц), являвшиеся вариантами LCA4 и LCA45, адаптированными под военные нужды (пассивное охлаждение, жёсткие температурные условия, пр.).

Первые чипсеты для EV4 использовали периферийные шины TURBOchannel, FutureBus+ и XMI. Хотя все эти реализации были очень скоростными для своего времени (около 100Мб/с на шину), они не получили широкого распространения, и количество доступной периферии измерялось единицами. Поэтому DEC обратила внимание на стандартные шинные архитектуры, такие как PCI и ISA (EISA). В начале 1994 был представлен чипсет DEC Apecs в двух исполнениях: с 64-битной системной шиной данных (21071) и 128-битной (21072). Вся разница между ними состояла в том, что 21071 состоял из 4 микросхем (1 универсальный контроллер, 2 микросхемы data slice, 1 контроллер шины PCI), а 21072 -- из 6 (дополнительно ещё 2 микросхемы data slice). Поддерживал частоту системной шины в 33МГц, до 16Мб B-cache и до 4Гб памяти FPM parity со временем доступа от 100 до 50нс. Поддержка шин ISA или EISA могла быть реализована посредством стандартных мостов, таких как i82378IB (ISA) или i82378EB (EISA).

Первая рабочая станция архитектуры Alpha от DEC была выпущена в ноябре 1992, DEC 3000 Model 500 AXP (кодовое имя Flamingo), с процессором EV4 150МГц, 512Кб B-cache, 32Мб оперативной памяти, SCSI HDD на 1Гб, SCSI CD-ROM, встроенным контроллером Ethernet 10Мбит (толстый коаксиал и витая пара), встроенным звуковым и ISDN контроллером, а также с 19-дюймовым монитором (1280х1024 8-бит). Цена была шокирующая: 38995 долл. США.

Часть 5. EV5, EV56, PCA56, PCA57


Первая архитектурная информация о своём Alpha-процессоре 2-го поколения была открыта DEC на конференции Hot Chips, которая состоялась 14 августа 1994 в Пало-Альто (Калифорния), хотя официальным анонсом21164(EV5) можно считать пресс-релиз DEC от 7 сентября 1994. Процессор базировался на ядре EV45 и содержал изменения скорее экстенсивного характера, чем интенсивного. Ядро включало удвоенное количество конвейеров для целочисленной и вещественной математики (по сравнению с EV4 или EV45), причём количество стадий вещественных конвейеров сократилось с 10 до 9. Однако, целочисленные конвейеры были неодинаковы: хотя оба могли выполнять элементарные арифметические и логические операции, только в компетенцию 1-го входило выполнение инструкций умножения и смещения, и только по 2-му могли быть направлены инструкции условных/безусловных переходов; также, оба конвейера могли вычислять виртуальные адреса для команд загрузки, однако только 1-й -- для команд сохранения. Вещественные конвейеры были также неоднородны: 1-й мог выполнять любой код с плавающей запятой, кроме инструкций умножения, которые были теми единственными командами, что мог выполнять 2-й конвейер. Чтобы обеспечить эффективную загрузку функциональных устройств, I-box мог выбирать и декодировать до 4 инструкций за такт. Производился по тому же 4-слойному 0,5µ CMOS5 техпроцессу, что и EV45, был рассчитан на напряжение питания в 3,3В, имел площадь ядра в 299 кв.мм. и содержал 9,3 млн. транзисторов (из них 7,8 млн. в виде интегрированного кэша), что было очень близко к теоретическому пределу для данного техпроцесса. Тактовые частоты EV5 составляли от266МГц до 333МГц(TDP от 46Вт до 56Вт). Форм-фактор: IPGA-499 (Interstitial Pin Grid Array).

Размеры и организация I-cache и D-cache остались как у EV4, то есть по 8Кб, и со сквозной записью для D-cache, хотя он теперь стал двухпортовым по чтению, то есть за 1 такт он мог поставить данные для 2 инструкций загрузки. Жертвуя транзисторами во имя быстродействия, физически D-cache состоял из 2 абсолютно одинаковых по содержанию частей размером в 8Кб каждая, то есть чтение шло из любой части, а запись -- одновременно в обе. Так как процессор имел 96Кб интегрированного кэша L2 с обратной записью с 3-канальной ассоциативностью, то в структуру C-box была добавлена его поддержка (S-cache, secondary cache) через независимую 128-битную шину данных, при этом интерфейс к внешнему B-cache (который все ещё оставался опциональным, набирался на микросхемах синхронной статической памяти и мог иметь размер до 64Мб, хотя обычно составлял от 1Мб до 4Мб) был сохранён -- другими словами,EV5 поддерживал 3 уровня кэшей. Доступ к S-cache был организован по принципу 4-стадийного конвейера: два такта на поиск тега и его изменение, два такта на доступ к данным и их передачу; строка S-cache была в 64 байта (с возможным разделением на две 32-байтных подстроки), с одним тегом на строку. Задержки при чтении из D-cache сократились до 2 тактов, а из S-cache -- составляли 7 тактов (как упоминалось выше, 4 такта на первые 16 байт, и по 1 такту на каждые последующие 16 байт для формирования полной строки). Как и в EV4, содержимое D-cache дублировалось, только теперь в S-cache; в свою очередь, для упрощения поддержки, B-cache был включающим S-cache, несмотря на разницу в ассоциативностях. Ёмкость I-TLB была увеличена до 48 записей (страницы размером от 8Кб до 4Мб), а D-TLB -- до 64 записей, причём он стал двухпортовым (по аналогии с D-cache). Системная шина данных имела фиксированную ширину в 128 бит (с дополнительными 16 битами для ECC) и всё так же мультиплексировалась с шиной данных к B-cache; системная шина адреса была 40-битной, управления -- 10-битной.

В октябре 1995, на Microprocessor Forum, был представлен 21164А (EV56), незначительно модифицированная версия EV5 с учетом 0,35µ конструкторских норм (CMOS6), производимая на той же фабрике в Хадсоне (DEC инвестировала в её модернизацию около 450 млн. долл США). Наиболее существенным архитектурным отличием можно считать BWX (Byte-Word Extension) -- набор из 6 дополнительных команд для загрузки/сохранения данных размером в 8 или 16 бит. Изначально архитектура Alpha поддерживала загрузку/сохранение данных квантами исключительно по 32 или 64 бита, что создавало определенные сложности при портировании или эмуляции кода других процессорных архитектур, например, i386 или MIPS. Предложение о внедрении BWX в базовый набор команд Alpha появилось в июне 1994 с подачи Ричарда Сайтса и было утверждено в июне 1995. Правда, для успешной работы BWX требовалась поддержка как со стороны процессора, так и со стороны чипсета. EV56 производился с тактовыми частотами от 366МГц до 666МГц (TDP от 31Вт до 55Вт), начиная с лета 1996. Samsung также выпускал EV56, по лицензионному соглашению с DEC от июня 1996 (версию на 666МГц производил только он). Содержал 9,66 млн. транзисторов, площадь ядра составляла 209 кв.мм., использовалось двойное напряжение (2,5В на основную логику и 3,3В на входные-выходные цепи).

17 марта 1997 был представлен 21164PC (PCA56), бюджетный вариант EV56, спроектированный совместно DEC и Mitsubishi. Отсутствовал S-cache и соответствующая логика, зато размер I-cache был увеличен вдвое (до 16Кб). Содержал 3,5 млн. транзисторов, имел площадь ядра в 141 кв.мм., использовал тот же техпроцесс и напряжение питания, что и EV56; форм-фактор процессора изменился: IPGA-413 против IPGA-499. Выпускался с тактовыми частотами от 400МГц до 533МГц (TDP от 26Вт до 35Вт). В будущем, на производственных мощностях Samsung, также выпускался 0,28µ вариант 21164PC (PCA57), с удвоенными размерами I-cache и D-cache, причём первый использовал 2-канальную ассоциативность. Количество транзисторов в ядре увеличилось до 5,7 млн., а его площадь уменьшилась (до 101 кв.мм.); был спроектирован под пониженное напряжение питания (2,0В на основную логику и 2,5В на входные-выходные цепи), с тактовыми частотами от 533МГц до 666МГц (TDP от 18Вт до 23Вт).

Кроме унаследованных от EV56 инструкций BWX, PCA56 поддерживал новый набор MVI (Motion Video Instructions), предназначенный для ускорения алгоритмов обработки видео и аудио потоков по принципу SIMD (Single Instruction -- Multiple Data), в некоторой мере сопоставимый с MMX.

Первым стандартным чипсетом, разработанным для EV5, был DEC Alcor (21171). Он поддерживал частоту системной шины в 33МГц, до 64Мб B-cache, до 8Гб памяти FPM ECC (используя шину памяти разрядностью в 256 бит), а также 64-битную шину PCI (33МГц). Поддержка шины ISA (EISA) могла быть реализована посредством стандартного моста, как и прежде. Встроенного контроллера IDE также не было (мог устанавливаться отдельной микросхемой других производителей). Физически чипсет состоял из 5 чипов: 1 универсального контроллера (включающего поддержку шины PCI), и 4 коммутаторов данных (data switch). Одновременно с запуском в производство EV56 была выпущена модификация Alcor, поддерживающая BWX -- Alcor 2 (21172). Дальнейшим развитием этой "чипсетной династии" стал одночиповый Pyxis (21174), который поддерживал системную шину с частотой в 66МГц и память SDRAM ECC 66МГц (правда, используя шину памяти с разрядностью в 128 бит). Для систем на основе PCA57 был разработан чипсет VLSI Polaris.

В виду ограничения количества символов в статье

Продолжение следует...

Показать полностью 11
IT Технологии Инженер Компьютерное железо Компьютер Alpha Производство История развития Чип Процессор Тестирование Электроника Инновации Длиннопост
5
11
TechSavvyZone
TechSavvyZone

Intel на грани: Исторический кризис легенды Кремниевой долины и поиск пути к спасению⁠⁠

3 месяца назад

Введение: Титаник полупроводниковой индустрии в бушующем океане

История Intel — это не просто летопись успехов технологической индустрии, а фундаментальная основа цифровой революции, определившая развитие человечества на протяжении последних пятидесяти лет.

Открывая любой современный компьютер, сервер или систему управления, мы неизбежно сталкиваемся с наследием этой корпорации. Но сегодня этот титан стоит на краю пропасти, и его судьба представляет собой не просто корпоративную драму, а вопрос стратегической безопасности технологического суверенитета Запада и глобальной технологической экосистемы в целом.

Кризис Intel многогранен и системен: это и потеря технологического лидерства, и серия стратегических просчетов, и финансовое напряжение, и фундаментальная проблема бизнес-модели в изменившемся мире. Анализ ситуации требует глубокого погружения в исторический контекст, понимания технологических аспектов полупроводникового производства и трезвой оценки экономических реалий.

В данной статье мы проведем всестороннее исследование причин, масштабов и последствий кризиса Intel, опираясь на глубокий анализ отраслевых экспертов из Stratechery и Semianalysis, а также на дополнительные источники. Мы рассмотрим:

Исторические корни величия Intel и бизнес-модель, которая привела ее к доминированию

Технологические и стратегические ошибки, приведшие к потере лидерства

Текущее катастрофическое финансовое положение компании

Амбициозный план спасения IDM 2.0 и его врожденные противоречия

Возможные сценарии будущего — от полного распада до национализации

Это история не только о корпорации, но и о законе Мура, глобальной конкуренции, и о том, что происходит, когда технологический гигант теряет ритм инноваций.

Часть 1: Истоки империи — Как Intel определила технологический век

1.1. Рождение Кремниевой долины: от Шокли к «Предательской восьмерке»

История Intel неотделима от истории возникновения самой Кремниевой долины. В середине 1950-х годов Уильям Шокли, один из изобретателей транзистора в Bell Labs, переехал в Пало-Альто, чтобы создать собственную компанию — Shockley Semiconductor Laboratory. Его выбор места был не случайным — он хотел быть ближе к своей больной матери, но именно это решение стало катализатором создания мирового технологического центра.

Несмотря на гений Шокли, его управленческие качества и параноидальный характер оказались разрушительными для его же компании. В 1957 году восемь талантливейших инженеров — Джулиус Бланк, Виктор Гринич, Джин Хорни, Юджин Кляйнер, Джей Ласт, Гордон Мур, Роберт Нойс и Шелдон Робертс — покинули Shockley Semiconductor. Этот поступок был настолько радикальным для того времени, что Шокли назвал их «Предательской восьмеркой» (The Traitorous Eight).

Именно эти восемь инженеров основали Fairchild Semiconductor — компанию, которая стала настоящей «платоновской пещерой» для всей современной полупроводниковой индустрии. По данным историков технологий, более 30 прямых spin-off компаний были созданы бывшими сотрудниками Fairchild, включая такие гиганты как AMD, National Semiconductor и, конечно, Intel.

1.2. Основание Intel и закон Мура как экономический императив

В 1968 году Роберт Нойс и Гордон Мур покинули Fairchild Semiconductor и основали Intel. Название компании образовано от сокращения INTegrated ELectronics — интегрированная электроника. Интересно, что изначально они планировали назвать компанию «Moore Noyce», но это название уже было trademarked сетью отелей, поэтому пришлось искать другие варианты.

Изначально Intel фокусировалась на производстве memory chips — чипов памяти SRAM и DRAM. Компания быстро добилась успеха в этом направлении, но настоящий прорыв произошел в 1971 году, когда Intel представила первый в мире микропроцессор — Intel 4004. Это изобретение фактически создало новую отрасль и заложило основу для персональных вычислений.

Но perhaps самым важным вкладом Intel в технологическую индустрию стало не конкретное изобретение, а формулировка экономического принципа, известного как «Закон Мура». В 1965 году Гордон Мур, тогда еще работая в Fairchild, заметил закономерность: количество транзисторов на микросхеме удваивается примерно каждые два года. Позже этот observation был уточнен и стал прогнозом, который фактически превратился в само исполняющееся пророчество и технологический императив.

Для Intel закон Мура стал не просто observation, а стратегической бизнес-моделью. Компания построила всю свою деятельность вокруг обязательства каждые два года значительно увеличивать производительность своих чипов, одновременно снижая стоимость вычислений. Эта модель требовала колоссальных инвестиций в НИОКР и производственные мощности, но создавала практически непроницаемый конкурентный ров.

1.3. Золотой век: стратегия вертикальной интеграции и доминирование на рынке

Бизнес-модель Intel десятилетиями была образцом стратегического преимущества. Компания была интегрированным производителем устройств (IDM — Integrated Device Manufacturer), что означало полный контроль над всем процессом: от проектирования чипов (design) до их производства на собственных фабриках (manufacturing). Эта вертикальная интеграция создавала мощные конкурентные преимущества:

Технологическое лидерство: Собственное передовое производство позволяло Intel первой внедрять новые техпроцессы, что давало её чипам преимущество в производительности и энергоэффективности. Компания могла оптимизировать дизайн чипов под конкретные производственные процессы и наоборот.

Экономика масштаба: Огромные фабрики (fabs) снижали себестоимость производства каждого чипа. Intel могла распределять фиксированные затраты на НИОКР и строительство фабрик по огромному объему продукции.

Контроль качества и поставок: Полный контроль над цепочкой создания стоимости обеспечивал стабильное качество и надежность поставок, что было критически важно для корпоративных клиентов.

Защита интеллектуальной собственности: Производство внутри компании уменьшало риск утечки ноу-хау и технологических секретов к конкурентам.

Эра Wintel и доминирование на рынке ПК

Особую роль в возвышении Intel сыграл стратегический альянс с Microsoft, известный как «Wintel» (Windows + Intel). Эта экосистема стала доминирующей платформой для персональных компьютеров на decades. Intel обеспечивала постоянно растущую производительность процессоров, а Microsoft создавала программное обеспечение, которое использовало эти возможности.

К 1990-м годам Intel контролировала более 80% рынка процессоров для ПК и серверов. Компания стала одним из самых прибыльных предприятий в мире технологий с маржинальностью, которой могли позавидовать даже самые успешные компании других отраслей.

Завоевание рынка серверов

Не менее впечатляющим был успех Intel на рынке серверов. Архитектура x86, которая изначально доминировала на рынке ПК, постепенно вытеснила специализированные RISC-процессоры (от IBM, Sun Microsystems и других) с рынка серверов. Более низкая стоимость и постоянное улучшение производительности процессоров x86 сделали их предпочтительным выбором для дата-центров.

К началу 2000-х годов Intel стала практически монополистом на рынке процессоров для серверов, контролируя более 95% этого рынка. Серверный бизнес стал основным источником прибыли для компании, поскольку серверные процессоры имели значительно более высокую маржу по сравнению с потребительскими чипами.

Часть 2: Эра стратегических ошибок — Как Intel упустила будущее

2.1. Слепота к мобильной революции: провал в сегменте смартфонов

Одной из самых значительных стратегических ошибок Intel стало почти полное игнорирование мобильной революции. Когда в 2007 году Стив Джобс представил iPhone, это ознаменовало начало новой эры вычислений — эры мобильных устройств. Однако Intel, сосредоточенная на своем высокомаржинальном бизнесе процессоров для ПК и серверов, не увидела в этом угрозы.

Официальная версия Intel годами заключалась в том, что компания сознательно отказалась от рынка мобильных процессоров, потому что он был низкомаржинальным и не соответствовал их бизнес-модели. Однако реальность, согласно свидетельствам инсайдеров, была сложнее.

Технические проблемы архитектуры x86

Главной проблемой стало то, что архитектура x86, на которой специализировалась Intel, была фундаментально менее энергоэффективной, чем архитектура ARM, доминирующая в мобильных устройствах. Как отмечает Тони Фаделл, один из создателей iPhone, Apple в середине 2000-х действительно рассматривала чипы Intel для iPhone, но они были непригодны из-за проблем с энергопотреблением.

«Мышление Intel никогда не было об этом... Они просто переупаковывали то, что у них было для десктопа, для ноутбука, а затем снова для встраиваемых систем», — отмечал Фаделл.

Intel пыталась исправить ситуацию, разрабатывая более энергоэффективные версии своих процессоров (линейка Atom), но они все равно не могли конкурировать с решениями на ARM по соотношению производительности к энергопотреблению. Не помогли и многомиллиардные инвестиции в субсидирование производителей устройств, чтобы те использовали чипы Intel.

Упущенная возможность стоила Intel не только рынка мобильных процессоров, но и будущего. Мобильные устройства стали доминирующей формой вычислений, а архитектура ARM, оптимизированная для мобильных устройств, начала проникать и в другие сегменты, включая ноутбуки и серверы.

2.2. Потеря производственного лидерства: как TSMC обошла Intel

Perhaps самый болезненный удар для Intel came от тайваньской компании TSMC, которая смогла обойти американского гиганта в технологической гонке.

Долгие годы Intel гордилась своим технологическим превосходством в полупроводниковом производстве. Компания первой внедряла новые техпроцессы и годами поддерживала лидерство. Однако в середине 2010-х годов ситуация начала меняться.

Ключевые причины потери производственного лидерства:

Задержка с внедрением EUV-литографии: Intel решила отложить внедрение крайне дорогой литографии с использованием крайнего ультрафиолета (EUV) для своего 10-нм техпроцесса, полагаясь на традиционную многопатерновую литографию. Это решение оказалось фатальным — сложность процесса привела к многолетним задержкам.

Технологические трудности с 10-нм процессом: Intel столкнулась с серьезными проблемами при освоении 10-нм техпроцесса, что привело к многократным переносам сроков. В то время как TSMC и Samsung успешно перешли на аналогичные и более продвинутые техпроцессы.

Консервативная корпоративная культура: По некоторым данным, инженерная культура Intel стала слишком консервативной и бюрократической, что замедляло принятие решений и внедрение инноваций.

Последствия были катастрофическими: к 2020 году TSMC не только догнала, но и уверенно обошла Intel, забрав себе титул лидера полупроводникового производства. Это мгновенно обесценило ключевое конкурентное преимущество Intel — передовое производство.

2.3. Возвышение AMD: как конкурент воспользовался ошибками Intel

Пока Intel боролась с внутренними производственными проблемами, ее главный конкурент AMD совершил одно из самых впечатляющих корпоративных comeback в истории технологий.

В 2014 году AMD наняла легендарного инженера Джима Келлера (который ранее работал над процессорами Apple A4/A5), чтобы возглавить разработку новой архитектуры. Результатом стала архитектура Zen, которая коренным образом изменила конкурентный ландшафт.

Преимущества новой стратегии AMD:

Отказ от собственного производства: AMD отделила свое производственное подразделение в отдельную компанию GlobalFoundries, а затем начала работать с TSMC. Это позволило AMD получить доступ к лучшим в мире производственным процессам.

Модульный дизайн чипов: AMD разработала модульный подход к проектированию процессоров (chiplets), что позволило создавать более гибкие и cost-effective решения.

Оптимизация под производство TSMC: В отличие от Intel, которая должна была проектировать чипы под собственные производственные процессы, AMD могла оптимизировать дизайн под передовые процессы TSMC.

Результат не заставил себя ждать: доля AMD на рынке процессоров для ПК и серверов начала steadily расти. На рынке дата-центров доля AMD приблизилась к 50%, что стало серьезным ударом по самому прибыльному сегменту бизнеса Intel.

2.4. Упущенная революция ИИ: как NVIDIA захватила новые рынки

Новая парадигма вычислений, связанная с искусственным интеллектом и машинным обучением, застала Intel врасплох. В то время как NVIDIA сфокусировалась на GPU как на платформе для параллельных вычислений, Intel продолжала пытаться адаптировать свою архитектуру x86 для новых workloads.

Проблемы Intel на рынке ускорителей ИИ:

Непонимание новых парадигм вычислений: Архитектура x86, оптимизированная для последовательных вычислений, плохо подходила для massively parallel вычислений, необходимых для deep learning.

Отсутствие единой программной платформы: В то время как NVIDIA создала унифицированную программную платформу CUDA, которая стала отраслевым стандартом для ИИ-разработчиков, Intel предлагала разрозненные решения.

Запоздалые приобретения: Покупка израильского стартапа Habana Labs и запуск ускорителя Gaudi 3 были правильными шагами, но они запоздали на несколько лет. Примечательно, что чипы Gaudi также производятся на заводах TSMC, а не Intel.

К 2024 году NVIDIA стала одной из самых valuable компаний в мире, в то время как Intel боролась за выживание. Рынок ускорителей ИИ стал одним из самых быстрорастущих сегментов полупроводниковой индустрии, и Intel практически отсутствовала на нем.

Часть 3: Глубина кризиса — Технологические, финансовые и стратегические проблемы

3.1. Технологический кризис: техпроцесс 18A как последняя надежда

Согласно анализу Semianalysis, текущая ситуация с техпроцессом Intel 18A представляет собой критически важный момент для компании. Этот техпроцесс является не просто очередным этапом развития, а последним шансом для Intel сохранить технологическую независимость и конкурентоспособность.

Ключевые проблемы с техпроцессом 18A:

Проблемы с выходом годных кристаллов: Внутренние оценки Intel, по данным источников Semianalysis, указывают на сохраняющиеся проблемы с выходом годных кристаллов на опытных производствах. Низкий yield rate может привести к очередным задержкам и невозможности наладить массовое производство с приемлемой себестоимостью.

Жесткие временные рамки: Рыночное окно для успешного запуска 18A ограничено. Если Intel не выйдет на массовое производство в 2025 году, компания может permanently отстать от TSMC и Samsung.

Конкуренция со стороны TSMC: Пока Intel пытается освоить 18A, TSMC уже работает над более advanced техпроцессами (2nm и ниже), создавая постоянно moving target.

Последствия провала 18A будут катастрофическими: Intel окончательно потеряет возможность конкурировать на рынке передовых полупроводниковых производств, что сделает бессмысленными амбициозные планы IDM 2.0.

3.2. Финансовый кризис: анализ катастрофических показателей

Финансовое положение Intel стремительно ухудшается, что ярко демонстрируют последние отчеты компании:

Рекордные убытки: В I квартале 2023 года Intel зафиксировала рекордный квартальный убыток в почти $3 млрд. Во II квартале 2024 года чистый долг компании достиг $1,61 млрд.

Структура долга: Intel активно привлекала заемные средства для финансирования капитальных затрат (строительство фабрик), и теперь обслуживание этого долга съедает львиную долю операционного cash flow.

Сокращение инвестиций в R&D: Впервые за десятилетия Intel вынуждена сокращать расходы на исследования и разработки будущих технологий, чтобы финансировать текущие операции. Это создает порочный круг: без прорывных технологий нет конкурентных продуктов, что ведет к дальнейшей потере рынка и доходов.

Потеря маржинальности: Рентабельность бизнеса Intel значительно снизилась из-за производственных проблем, ценового давления со стороны AMD и высоких капитальных затрат.

Сравнительный анализ финансовых показателей Intel и основных конкурентов:

Стратегический кризис: фундаментальные проблемы IDM 2.0

Вернувшись в 2021 году на пост CEO, Пэт Гелсингер представил план спасения под названием IDM 2.0. Его суть — попытка трансформировать внутреннее производственное подразделение в конкурентоспособную foundry-службу, которая будет работать и на Intel, и на внешних заказчиков. По мнению Гелсингера, только так компания может сохранить инвестиции в дорогостоящие разработки передовых техпроцессов.

Однако у этой модели есть фундаментальная проблема конфликта интересов:

Вопрос приоритетов: Собственные проекты Intel (процессоры для ПК, серверов) всегда будут иметь приоритет для внутреннего производства перед заказами сторонних клиентов. В условиях дефицита производственных мощностей внешние клиенты окажутся в невыгодном положении.

Вопрос доверия: Сможет ли, например, NVIDIA или Qualcomm доверить проекты своих самых передовых чипов своему прямому конкуренту? Это маловероятно. Semianalysis сообщает, что несколько ключевых потенциальных клиентов Intel Foundry Services уже свернули переговоры или приостановили совместные проекты.

Экономическая неэффективность: Бизнес по производству чипов (как у TSMC) имеет рентабельность около 50%, в то время как бизнес по проектированию (как у NVIDIA) — 60-65%. Интеграция этих двух моделей под одной крышей создает постоянное внутреннее напряжение и не позволяет оптимизировать структуру затрат.

Дополнительные проблемы IDM 2.0:

Нереалистичные сроки: План «5 узлов за 4 года» изначально был амбициозным, но теперь, по данным инсайдеров, признан невыполнимым даже внутри компании.

Отток кадров: Демотивация инженерного состава и отток лучших кадров в AMD, NVIDIA и TSMC ослабляет способность Intel реализовывать амбициозные планы.

3.4. Реакция рынка и инвесторов: растущее давление

Рыночная реакция на кризис Intel была однозначной: акции компании значительно underperformed по сравнению с другими полупроводниковыми компаниями. За последние 5 лет акции Intel выросли лишь на 15%, в то время как акции NVIDIA — на 1200%, AMD — на 300%, а TSMC — на 150%.

Давление со стороны инвесторов:

Требования активистов: Крупные институциональные инвесторы все активнее требуют от совета директоров рассмотреть возможность радикального разделения компании на design-house и pure-play foundry.

Смена руководства: Некоторые инвесторы открыто призывают к смене CEO, arguing что Пэт Гелсингер не смог предложить жизнеспособный план спасения компании.

Сокращение дивидендов: Компания была вынуждена значительно сократить выплаты дивидендов, что вызвало недовольство income-ориентированных инвесторов.

Часть 4: Возможные сценарии будущего — От распада до трансформации

4.1. Сценарий 1: Полное разделение (наиболее вероятный)

Согласно анализу как Stratechery, так и Semianalysis, наиболее вероятным и целесообразным сценарием является полное разделение Intel на две независимые компании:

Intel Design: Компания, занимающаяся проектированием процессоров для ПК, серверов и других устройств. Эта компания могла бы конкурировать с AMD, Apple и ARM, используя для производства лучшие доступные foundry-услуги (TSMC, Samsung или новая Intel Foundry).

Intel Foundry: Чистая foundry-компания, которая would конкурировать с TSMC и Samsung. Эта компания могла бы привлекать внешних клиентов, не вызывая подозрений в конфликте интересов.

Преимущества этого подхода:

Устранение конфликта интересов

Возможность привлечения внешнего финансирования для каждого бизнеса

Повышение операционной эффективности

Более четкая фокусировка на конкретных рынках

Недостатки и challenges:

Сложность и стоимость разделения

Потежа синергии между design и manufacturing

Необходимость создания отдельных управленческих команд

4.2. Сценарий 2: Экстренная национализация

Второй возможный сценарий, который становится все более обсуждаемым в свете геополитической напряженности — частичная или полная национализация ключевых производственных активов Intel.

Логика этого сценария: Правительство США, руководствуясь соображениями национальной безопасности, может выкупить контрольный пакет акций или ключевые производственные активы (фабрики), чтобы гарантировать поставки чипов для ВПК и критической инфраструктуры.

Преимущества этого подхода:

Гарантированный доступ к advanced semiconductor manufacturing для нужд национальной безопасности

Сохранение технологического суверенитета США

Финансовая поддержка дорогостоящих капитальных затрат

Недостатки и risks:

Политическая противоречивость национализации в США

Неэффективность, характерная для государственных предприятий

Это не решит проблему отсутствия конкурентоспособных технологий

4.3. Сценарий 3: Поглощение или слияние

Третий сценарий предполагает поглощение Intel или ее частей другими технологическими гигантами.

Возможные варианты:

Поглощение Qualcomm: Появилась информация, что Qualcomm рассматривает возможность покупки Intel. Однако эта сделка выглядит крайне рискованной. Аналитик Минг-Чи Куо предупреждает, что гигантский долг и проблемы Intel могут «утянуть на дно» и саму Qualcomm.

Покупка Apple: Apple может быть заинтересована в патентах и инженерном таланте Intel, особенно в light собственных планов по разработке чипов.

Разделение и продажа по частям: Наихудший сценарий, при котором активы компании (патенты, фабрики, IP) распродаются по частям различным покупателям.

Вероятность этого сценария оценивается как низкая из-за regulatory hurdles, огромной стоимости сделки и сложности интеграции такой крупной и проблемной компании.

4.4. Сценарий 4: Управляемое банкротство и реструктуризация

Наихудший сценарий для Intel — это банкротство по главе 11 и последующая фундаментальная реструктуризация.

В этом сценарии компания была бы защищена от кредиторов while она реструктуризирует свои операции и долги. Это позволило бы избавиться от непосильного долгового бремени и непрофильных активов, но нанесло бы catastrophic ущерб бренду и отношениям с клиентами.

Вероятность этого сценария в краткосрочной перспективе низка, но становится более реальной, если техпроцесс 18A потерпит неудачу и финансовые показатели продолжат ухудшаться.

Часть 5: Заключение — Необходимость стратегической честности

Кризис Intel представляет собой не просто корпоративную драму, а поворотный момент для всей полупроводниковой индустрии и технологического ландшафта в целом. История компании демонстрирует, как даже самые успешные технологические гиганты могут столкнуться с экзистенциальными угрозами, если утратят способность к инновациям и стратегическому foresight.

Главный вывод из кризиса Intel — это необходимость стратегической честности. Компания должна честно признать, что её классическая интегрированная модель, принёсшая ей десятилетия процветания, более не работает в современном мире. Цепляние за прошлое и попытка сохранить статус-кво лишь усугубляют падение.

Путь к спасению для Intel лежит через радикальную трансформацию...

Показать полностью 9
[моё] Инженер IT Технологии Компьютерное железо Производство Intel Процессор AMD Электроника Промышленность Компьютер Автоматизация История развития Tsmc Длиннопост
12
84
TechSavvyZone
TechSavvyZone

Известные бренды, неожиданные провалы⁠⁠

4 месяца назад

Обычно смелые и необычные эксперименты — удел стартапов. Но подчас даже авторитетные компании выпускают такие своеобразные устройства, что поверить трудно. Вспомним несколько таких гаджетов: смешных, оригинальных, курьезных, а порой и опередивших свое время.

1. Macintosh Portable (1989 год)

Слово Portable в названии этого агрегата выглядит иронично. Только настоящий фитнес-энтузиаст мог бы назвать портативным чемодан массой в семь с лишним кило! Большая их часть приходилась на огромный кислотно-щелочной аккумулятор. Причем избавиться от него было нельзя, ведь с разряженной батареей Macintosh Portable не включался даже от сети — комплектный зарядник не справлялся. Упоминать про лишенный подсветки 9,8-дюймовый дисплей, которым невозможно было пользоваться в темноте, даже как-то неспортивно. При всем этом первый лэптоп Apple стоил как автомобиль — 7300 долларов. Вспоминайте его, когда ваш ноутбук покажется слишком тяжелым или дорогим.

2. Nintendo Power Glove (1989 год)

Консольные эксперименты — любимый конек Nintendo. Некоторые, например 3DS или Wii, оказались успешными. Другие, вроде Virtual Boy или Power Glove, провалились. Девайс привносил на NES управление жестами — и оно толком не работало даже с играми, которые были специально созданы под Power Glove (а таковых было аж целых две). Что уж говорить про все остальные! На всякий случай манипулятор оснастили традиционными кнопками… где-то в районе предплечья. Играть с обычным геймпадом было куда приятнее, чем тратить нервы на футуристичную, но неотзывчивую, неточную и неудобную Power Glove. Впрочем, выглядела киберперчатка круто — этого у нее не отнять.

3. Casio VDB-1000 (1991 год)

Инженеры Casio всегда пытались превратить часы в нечто большее, чем обычный хронометр. Прадедушку современных smartwatch снабдили весьма солидным функционалом вроде калькулятора, телефонной книги и мирового времени. Причем производитель был настолько уверен в сенсорном управлении, что лишил громоздкие часы короны и вообще любых физических кнопок. Правда, крохотный монохромный тачскрин реагировал через раз, корпус был громоздким, а мощностей железа едва хватало для работы электронного органайзера. Пять за предвидение будущего — двойка за реализацию.

4. Macintosh TV (1993 год)

Идея умного ТВ родилась в стенах «яблочной» компании задолго до Apple TV. Еще в октябре 1993 года на свет появился гибрид компьютера и 14-дюймового CRT-телевизора Sony Trinitron с ИК-пультом в комплекте. Правда, одновременно использовать ТВ и ПК было нельзя. Плюс, как и большинство технических химер, Macintosh TV толком ничего не умел. Запредельная цена в $2099 и слабое железо добили новинку. Продать удалось что-то около 10 000 штук, и через год девайс канул в Лету. Зато он навсегда остался в истории как первый компьютер Apple черного цвета.

5. Logitech CyberMan (1993 год)

В первой половине 90-х все были без ума от Doom и других 3D-игр. Чтобы сделать управление в них предельно удобным, в Logitech скрестили мышь и джойстик. Получилось плохо. Да, CyberMan предлагала целых шесть степеней свободы, поддерживала наклоны и даже давала обратную связь (редкая штука для тех далеких времен). К сожалению, контроллер вышел слишком сложным, страдал от плохой эргономики и мгновенно утомлял. Второе поколение CyberMan вышло еще более странным, чем первое, и популярности тоже не снискало. В итоге эти устройства так и остались лишь символами инноваций, которых очень не хватает игровой периферии сегодня.

6. Microsoft ActiMates (1997 год)

Обойтись в этом материале без устройства Microsoft было бы неправильно. Но Zune и Kin не обсудил, кажется, только ленивый. А вот поющего фиолетового динозавра, которого нужно было подключать к видеомагнитофону по радиоканалу, вспоминают гораздо реже. Немудрено: интерактивные игрушки серии ActiMates были дорогими, сложными и, чего греха таить, жутковатыми. Зато они могли петь, танцевать и даже разговаривать с ребенком. Словарный запас ящера Барни достигал 14 000 слов! К сожалению, чтобы выжать из кукол все возможное, нужно было отдельно покупать специальный ресивер и видеокассеты, а потом еще возиться с настройкой. Технические ограничения VHS и всеобщий переход на DVD поставили на ActiMates крест: интерактивные игрушки продержались на рынке всего три года. Зато у них была версия с телепузиками.

7. Nokia 7280 (2004 год)

В истории Nokia хватало странных телефонов, но аппарат с индексом 7280, пожалуй, самый своеобразный из них. Даже сложно поверить, что эта губная помада для роботов — полноценный мобильник на базе Symbian OS. Экран не был сенсорным, а место традиционной цифровой клавиатуры заняло прорезиненное колесико с кнопкой по центру. Такая схема управления подошла бы MP3-плееру, но уж точно не мобильнику. Даже элементарно набрать номер на таком гаджете было большой проблемой, что уж говорить про SMS. Тот случай, когда модный дизайн победил логику. Впрочем, ничто не помешало Nokia выпустить еще несколько «дамских» моделей в аналогичном форм-факторе.

8. Sony Tablet P (2011 год)

Интересный планшет, который опередил моду на складные экраны и провалился. Ни о каких гибких матрицах тогда не шло и речи: два 5,5-дюймовых дисплея разделяла толстенькая рамка. Tablet P нормально работал с очень ограниченным набором фирменного софта и не позволял выводить разные приложения на экраны одновременно. К тому же девайс получился слишком громоздким: весил без малого 400 г при толщине 28 мм — в карман такой кирпичик не положишь. Немудрено, что попытка объединить Android-планшет с Nintendo DS провалилась. От обычной клавиатуры вместо второго экрана толку было бы значительно больше.

9. Samsung Galaxy Beam (2012 год)

В свое время Samsung тоже не чуралась экспериментов. Яркий пример — смартфон со встроенным DLP-проектором. Правда, сам проектор был на редкость тусклым (всего 15 лм) и выдавал картинку в жалком разрешении 640х360 пикселей при диагонали проекции до 50 дюймов. Максимум, на что годился такой гаджет, — смотреть диафильмы под одеялом. Как смартфон Galaxy Beam тоже звезд с неба не хватал: был весьма увесистым, не слишком мощным и довольно дорогим (рекомендованная цена — 539 евро на старте). Все это предопределило его скромную популярность.

10. Polaroid Socialmatic (2014 год)

Хотите, чтобы покупатель фотокамеры сразу понял: она создана специально для молодежи? Сделайте корпус в виде иконки соцсети! И не важно, если в результате получится предельно неуклюжий кирпич со встроенным принтером. Главной фишкой Socialmatic стало умение мгновенно печатать снимки размером 2х3 дюйма на специальной бумаге ZINK без использования чернил, а заодно сразу публиковать их в интернете. К сожалению, камера снимала и печатала одинаково плохо, а ОС Android на борту жестоко тормозила. Осовременить ретро-стиль моментальной фотографии Polaroid у разработчиков не получилось.


P/S

Подобных неудачных экспериментов было очень много, от явной наркомании до чересчур опередивших своё время как смартфон IBM Simon 1992 года имевший сенсорный экран и не имевший клавиатуры. 

Seiko TV Watch — 1982

На разработку часов было затрачено сто миллионов иен. В начале Тв-часы можно было купить только в Токиио и Осаке. В начале модель часов DXA001 продавались за 108000 иен, но когда часы стали продаваться и появилась новая модель DXA002 по всей Японии, их цена упала до 98000 иен (В то время это было примерно 500-600 евро)

Устройство часов:
Часы имели размер 40*49*10 мм , часы и ремешок были сделаны из нержавеющей стали, в часы размещалась батарейка с монету типа SR920W, вес часов был 80 грамм, приемник с 2 щелочными батарейками ААА весил 190 грамм.
У часов был ну очень шумный спикер дисплей имел 1,2 дюйма , подсветка была белой или синей в зависимости от модели. Часы могли проработать 5 часов от одного комплекта батареек. Внешний тюнер позволял ловить от 2 до 83 каналов имелся FM-стерео радио приемник. Так же часы могут работать как секундомер и как будильник.

Как видите, даже крупные, известные и чрезвычайно успешные компании иногда ошибаются. Но именно такими ошибками вымощена дорога технологиям, которые мы используем сегодня. Так что скажем их авторам спасибо за смелость. Ведь кто знает: может, через десять лет мы будем смеяться над тем, что сейчас считаем вершиной прогресса.

Показать полностью 13
IT Инженер Компьютерное железо Технологии Компьютер Бренды Провал Apple Microsoft Производство История развития Электроника Sony Samsung Гаджеты Polaroid Длиннопост
18
0
itstorytelling
itstorytelling
Информатика • Алексей Гладков

Реальная история iOS / Информатика⁠⁠

5 месяцев назад

Друзья, здравствуйте)

Реальная история iOS / Информатика

Реальная история iOS / Информатика

А что если я вам скажу, что за безупречной репутацией скрывается множество скрытых фактов, о которых вы даже не подозревали? Забудьте на минутку красивые легенды об "революции iPhone". Сегодня – только факты. Реальная история iOS – это история жёстких компромиссов, украденных идей и внутренних войн в Apple. Пока мир восхищался сенсорным интерфейсом, за кулисами кипели нешуточные страсти.

Кто реально придумал ключевые фишки iOS, и почему их имена нам неизвестны? Какую роль сыграл провал Newton в создании iOS? Почему первые айфоны были так "закрыты", и кто внутри Apple сопротивлялся этому тоталитарному подходу?

В нашем видео  "Реальная история iOS" мы раскроем то, что не попадает в официальные хроники "успеха".

Версия для RuTube
Версия для YouTube

👇👇Наш канал на других площадках👇👇
YouTube | RuTube | Telegram | Pikabu
=====================================

Показать полностью 1
[моё] Научпоп Наука Ученые Технологии Apple iOS Mac Стив Джобс Информатика Секрет Тайны Расследование Факты История развития Цифровые технологии История IT Видео YouTube Информатика Алексей Гладков
0
44
TechSavvyZone
TechSavvyZone

Ностальгия СССР: "Радиодетали"⁠⁠

6 месяцев назад

Для чего в радиодеталях времен СССР использовалось большое количество драгоценных металлов

В СССР при производстве радиодеталей использовалось большое количество золота, серебра, платины, палладия, родия, иридия. Для чего это делалось, и каким образом влияло на надежность и параметры радиоэлементов. И как теперь скупщики наживаются на извлечении драгметаллов из радиоэлементов.

Область применения драгоценных металлов, как в России, так и в других странах не ограничивается только ювелирными изделиями или созданием золотовалютного резерва. Драгметаллы активно используются при производстве широкой номенклатуры радиокомпонентов. Различных микросхем, микропроцессоров, транзисторов, конденсаторов, радиоламп и многого другого. Причем во времена СССР количество драгметаллов применяемых в радиокомпонентах было нескромно большим. Я бы даже сказал, огромным. В том же США драгметаллы в радиокомпонентах использовались куда более экономно.

  Так с какой же целью в радиокомпонентах применялись и применяются до сих пор драгметаллы. Ясно, что не для красоты, как например, в золотых часах. А применяются они для значительного увеличения надежности и срока службы, а также для улучшения параметров радиокомпонентов. 

Применение золота.

  Разберемся сначала с золотом, которое в СССР без оглядки на какую-либо экономию применялось в микросхемах, микроконтроллерах, транзисторах. И выясним, за счет чего оно повышало надежность и улучшало их параметры. В качестве примера приведу вариант использования золота в микросхемах. 

  Дело в том, что любая микросхема состоит из кремниевого кристалла, на котором вытравлены целые логические схемы из транзисторов, резисторов и других элементов. И этот кристалл (его контактные площадки) необходимо электрически надежно, тонкой проволокой, соединить с выводами микросхемы. 

Подключение контактов кремниевого кристалла к выводам микросхемы

Подключение контактов кремниевого кристалла к выводам микросхемы

  Вот тут во времена СССР, когда соответствующие технологии не были еще развиты и возникали большие трудности. Для надежного соединения кремния и выводов нужен был такой металл, с учетом тех технологий, который обеспечивал бы высокую адгезию к кремнию, имел приблизительно такой же температурный коэффициент линейного расширения, был пластичен, не окислялся и не был подвержен переносу ионов металла (электромиграции) в кристалл кремния. Не выполнение этих условий очень пагубно сказывалось на надежности и параметрах микросхем. Практически все металлы очень плохо подходили для этих целей. И только золото максимально соответствовало этим требованиям и почти идеально подошло. 

Подключение контактов кристалла в выводам золотыми проводниками

Подключение контактов кристалла в выводам золотыми проводниками

  Потому на протяжении десятилетий успешно и использовалось. По тем же причинам и приходилось садить кристалл на подложку, покрытую именно золотом. 

  То есть, расплатой или компенсацией, как вам будет угодно, за несовершенство технологий тех времен было использование золота в больших количествах. Это уже сейчас современные технологии позволяют применять вместо золотой проволоки алюминиевую, но надежность в этом случае все равно ниже. Поэтому в ответственных радиокомпонентах и по сей день используют золото.

  Золотом во времена СССР также обильно покрывались выводы и корпуса микросхем.

Золотом покрыты выводы, подложка и крышка микросхемы, то есть, все что можно.

Золотом покрыты выводы, подложка и крышка микросхемы, то есть, все что можно.

  Поскольку золото химически очень стойкое вещество и в химическую реакцию вступает с большим трудом, то и защищенные им микросхемы могут работать в химически агрессивной среде, не подвергаясь коррозии и разрушению. А пайка позолоченных выводов происходила очень легко и давала наилучшее качество соединения.

  В ваших компьютерах тоже есть золото, его вы можете сами увидеть воочию, например, золотом покрыты контакты центрального процессора.

Слой золота на контактах центрального процессора компьютера. 

Слой золота на контактах центрального процессора компьютера. 

Есть золото и в смартфонах, его легко увидеть на контактах сим-карт. 

Слой золота на контактах сим-карты. 

Слой золота на контактах сим-карты. 

Также золото активно применялось и в радиолампах. Им покрывались некоторые электроды для предотвращения вторичной эмиссии электронов. Это вредное явление заключается в том, что электроны, испускаемые катодом и ускорившиеся в электрическом поле радиолампы, попадая на анод, выбивают из него вторичные электроны. При этом анодный ток уменьшается, так как выбитые электроны осаждаются на других электродах и создают ток в их цепях. 

Слой золота на сетке разобранной радиолампы

Слой золота на сетке разобранной радиолампы

На сетке в центре радиолампы виднеется желтоватый слой золота

На сетке в центре радиолампы виднеется желтоватый слой золота

  Для предотвращения этого эффекта или значительного его уменьшения и используется золотое покрытие электродов. Чтобы вторичный электрон мог покинуть поверхность электрода, которая покрыта золотом, он должен обладать гораздо большей энергией, чем для покидания электродов покрытых другими металлами. Поэтому в случае с золотом количество выбитых вторичных электронов будет значительно меньше. 

Применение драгметаллов платиновой группы

  Теперь выясним, зачем в радиокомпонентах использовались металлы платиновой группы. 

  В качестве примера приведу известные у скупщиков радиодеталей конденсаторы КМ3 – КМ6, за богатое в них содержание платины (в КМ Н30) и палладия (в КМ Н90). Использование в конденсаторах этих драгметаллов мера также вынужденная. И направлена прежде всего на повышение их надежности и улучшение параметров. 

Знаменитые конденсаторы КМ содержащие платину и палладий.

Знаменитые конденсаторы КМ содержащие платину и палладий.

  Ранее обкладки предшественников этих конденсаторов делались путем вжигания серебра в керамический диэлектрик. Но серебро быстро диффундировало (проникало) в керамику, его молекулы под действием электрического поля выстраивались в цепочки и замыкали обкладки, что приводило к пробою. Для устранения этой проблемы на керамику стали сначала наносить тонкий слой платины или палладия, и только потом слой серебра. Дело в том, что платина и палладий не диффундируют в керамику и проблема быстрого выхода из строя конденсаторов была решена. Кроме того применение платины и палладия позволило значительно повысить допустимую рабочую температуру конденсаторов и сделать их параметры мало зависимыми от температуры. В результате конденсаторы КМ получились весьма надежными и имели стабильные параметры.

  В качестве еще одного примера приведу электромагнитные реле, предназначенные для коммутации ответственных цепей. В них в качестве контактов широко применялась, применяется и сейчас платина. 

Реле с контактами из платины

Реле с контактами из платины

Платиновые контакты, демонтированные с.реле.

Платиновые контакты, демонтированные с.реле.

  Применяется она не в чистом виде, а в виде сплавов с небольшой долей других металлов. Здесь используется другие ее свойства.

     Во-первых, высокая устойчивость к дугообразованию при размыкании контактов реле. То есть ток, при котором возникает электрическая дуга между платиновыми контактами значительно выше, чем у других металлов. Поэтому диапазон коммутируемого ими тока (без образования дуги) больше, чем у других реле. 

    Во-вторых, переходное сопротивление между замкнутыми контактами при небольших контактных давлениях достаточно мало. Что позволят коммутировать небольшие токи с очень малыми потерями. 

    В-третьих, контакты из сплавов платины имеют высокую твердость, это снижает их износ и значительно увеличивает срок службы.  

    Но здесь следует отметить, что для коммутации очень малых токов, менее 100 мА, используются контакты из золота, а не из платины. 

Реле с золотыми контактами.

Реле с золотыми контактами.

  Дело в том, что при очень малых токах переходное сопротивление между платиновыми контактами увеличивается и становится нестабильным, что приводит к увеличению потерь коммутируемого тока. А сопротивление между золотыми контактами остается очень малым. Но реле с золотыми контактами не пригодны для коммутации тока свыше 1А, превышение этого значения приведет к разрушению контактов. 

Почему в современных радиокомпонентах драгметаллов стало меньше или не стало совсем.

  Но не всегда при производстве радиокомпонентов использовалось большое количество драгметаллов. Самое большое их количество было в радиодеталях, произведенных до 1986 года в СССР. Тогда технологии, например, нанесения золота, были далеки от совершенства, и используемый метод гальванизации создавал толстенный слой золота в 2 мкм. Для сравнения, современный метод иммерсионного осаждения способен создавать слой золота менее 0,1 мкм. Технологии нанесения других драгметаллов в то время также были весьма расточительны. Но по мере развития технологий удавалось использовать драгметаллы более экономно, без заметного снижения качества радиокомпонентов. 

Микросхемы 2006 года выпуска, уже без использования золота. 

Микросхемы 2006 года выпуска, уже без использования золота. 

Но с 1992 года в ущерб качеству и надежности количество используемых в них драгметаллов резко уменьшилось, или, же вообще отсутствовало. Причиной этого явилось постановление правительства, которое предписывало жестко экономить драгметаллы во всех сферах и отраслях государства.

   Почему скупщики охотятся за советскими радиодеталями.

  Если в радиокомпонентах есть драгметаллы, значит, их можно извлечь. Процесс извлечения драгметаллов называется аффинаж. Он давно уже отработан, и на крупных предприятиях, и в гаражах умельцами – одиночками. Процесс аффинажа довольно непростой, требует хороших знаний химии, наличия различных кислот и реактивов. Кроме того пары выделяемые при реакциях в процессе аффинажа очень ядовитые и необходимо быть очень осторожным. Но, несмотря на все это, люди все равно занимаются извлечением драгметаллов из радиокомпонентов в своих гаражах и сараях, так как это очень выгодно. И охотятся за теми радиодеталями, в которых больше всего драгметаллов. А это именно радиодетали времен СССР.

  Например, из 1 килограмма конденсаторов КМ Н90 можно извлечь до 46 грамм палладия.

Керамические конденсаторы КМ6  Н90 содержащие палладий.

Керамические конденсаторы КМ6  Н90 содержащие палладий.

  А из 1 килограмма КМ Н30 до 50 грамм платины. 

Керамические конденсаторы КМ3 и КМ4 Н30 с содержанием платины. 

Керамические конденсаторы КМ3 и КМ4 Н30 с содержанием платины. 

Очень много людей знают о наличии в радиокомпонентах драгметаллов или хотя бы слышали об этом или читали. Очень многие скупают их и извлекают драгметаллы. Но немногие знают для чего и почему при производстве радиокомпонентов использовались драгметаллы, используются и сейчас, хотя и в гораздо меньших объемах.

Показать полностью 17
Технологии Промышленность Техника Радиодетали Электроника История развития Золото Драгметаллы Длиннопост Платина
13
60
TechSavvyZone
TechSavvyZone

Технологии: "Инструкции AVX-512" зачем они нужны процессору⁠⁠

6 месяцев назад

В линейке процессоров Ryzen 7000 компания AMD осуществила поддержку инструкций AVX-512. Тех самых, которые заблокировала в своих процессорах для массовых платформ компания Intel. Для чего нужны эти инструкции, какую реальную пользу они несут, и будет ли поддержка AVX-512 реальным преимуществом AMD перед конкурентом?

Что такое AVX-512

Инструкции семейства Advanced Vector Extensions (AVX) являются дальнейшим развитием инструкций семейства Streaming SIMD Extensions (SSE). Прародителем последних, в свою очередь, являются инструкции MultiMedia eXtensions (MMX), впервые появившиеся в 1997 году в процессорах Pentium MMX. За четверть века эволюции этого семейства инструкций их основное предназначение оставалось неизменным: ускорение работы программного обеспечения, работающего с мультимедийным контентом, к которому относится фото, видео или 3D-модели.

MMX использует 64-битные регистры, семейство SSE удваивает этот параметр до 128 бит. AVX первого и второго поколения работает с 256-битными регистрами, а последний в линейке — AVX-512 (как следует из названия, с 512-битными).

С каждой версией мультимедийных инструкций появляется все больше сценариев для их использования благодаря постоянному появлению новых функций. А расширение регистров, в свою очередь, дает возможность значительно ускорить работу этих сценариев. При грамотной оптимизации программного обеспечения для более «широких» инструкций можно добиться кратного повышения производительности по сравнению с использованием более «узких».

Почему Intel отказалась от AVX-512

Первой ранняя реализация 512-битных инструкций была применена в ускорителях вычислений Intel семейства Xeon Phi. Но по-настоящему массовое распространение уже стандартизированный AVX-512 получил в серверных процессорах Xeon на архитектуре Skylake. В десктоп новые инструкции впервые попали в 2017 году, вместе с HEDT-платформой Intel на базе чипсета X299 и процессоров Core i7-X 7000 серии, использующих архитектуру серверных моделей. Позже в линейку процессоров, которые поддерживают AVX-512, добавились Core-X 9000 и 10000 серии, работающие на той же платформе.

Несмотря на то, что массовые платформы тех лет тоже полагались на архитектуру Skylake, поддержки 512-битных инструкций в них не было. Дебют AVX-512 в массовых десктопных и мобильных платформах состоялся с 11 поколением процессоров Core архитектур Rocket Lake и Ice Lake в 2021 году.

При выходе процессоров 12 поколения на новой гибридной архитектуре Intel уточнила, что для задействования AVX-512 нужно будет отключить малые ядра, так как у них поддержки данных инструкций нет. Но позже компания решила вообще отказаться от AVX-512 на процессорах данного поколения в новых ревизиях процессоров. А чтобы ее не было и в старых, обязала производителей материнских плат выпустить обновления BIOS, отключающие данную технологию.

Почему? Причин на это несколько. Во-первых, при использовании новых инструкций и так не холодные процессоры Alder Lake потребляют намного больше энергии и еще сильнее разогреваются — температуры под нагрузкой увеличиваются на десяток-полтора градусов. При таком использовании приемлемые результаты охлаждения начинают показывать только дорогие кулеры и водяные СО. То же самое было и в предыдущем поколении Rocket Lake при задействовании AVX-512.  

Во-вторых, в линейке этих процессоров есть младшие модели без малых ядер. По этой причине AVX-512 у них должен быть активен по умолчанию, в отличие от «танцев с бубнами» с отключением малых ядер в BIOS для работы технологии у старших моделей. Это представляет последние в невыгодном свете.

В-третьих, Intel считает наличие 512-битной версии AVX в данный момент необязательным в массовых платформах по причине их малой распространенности в пользовательском программном обеспечении, в отличие от серверного.

Вернет ли Intel AVX-512 в массовые платформы? Да, но точно не в этом году. В новом 13 поколении процессоров Core малые ядра архитектуру не сменят, и AVX-512 в них не появится. Скорее всего, 512-битные мультимедийные расширения вернутся в 14 поколении процессоров Core, малые ядра которого получат новую процессорную архитектуру, то есть — не раньше конца следующего года.

Почему AMD пришла к AVX-512 только сейчас

Серверные процессоры AMD, в отличие от продукции конкурента, до сих пор не поддерживают AVX-512. AMD вводит поддержку нового набора инструкций только в этом году на десктопных Ryzen 7000, сердцем которых стала архитектура Zen 4. Позже будут выпущены серверные и HEDT-процессоры на той же архитектуре, которые унаследуют поддержку инструкций от младших собратьев.

При этом возникают два вопроса: почему AMD не добавила поддержку AVX-512 в серверы раньше? И почему, в отличие от конкурента, ее десктопные процессоры получат поддержку инструкций раньше серверных и HEDT? Ответ прост: все дело в унификации. Все процессоры AMD собираются из одних и тех же чиплетов — как десктопные, так и серверные. Именно поэтому сначала представляются десктопные процессоры на новой архитектуре с малым количеством чиплетов, а позже — серверные и HEDT с большим количеством тех же самых базовых «кирпичиков».

Intel разрабатывает разные кристаллы для десктопных и серверных процессоров, поэтому ненужные блоки в десктопные кристаллы она может просто не включать еще на стадии их проектирования, как это было сделано с процессорами на архитектуре Skylake.

Смысла же добавлять инструкции AVX-512 у AMD до этого года было немного. Пользовательское программное обеспечение до сих пор умеет задействовать их с видимой пользой лишь в достаточно редких случаях. Серверное — немного чаще, но тоже не всегда. При этом в серверах процессоры AMD и так зачастую быстрее продукции конкурента даже без новых инструкций — просто за счет большего количества ядер.

Однако, рано или поздно новые инструкции должны были попасть и в процессоры AMD. Ryzen 7000 серии помимо новой архитектуры получили и новый техпроцесс производства — 5 нм, который положительно скажется на энергопотреблении в работе с энергоемким AVX-512. К тому же, серверное ПО все активнее разрабатывается с учетом AVX-512, а чиплеты архитектуры Zen 4 попали и в серверные процессоры. Поэтому компания решила, что время и для ее реализации AVX-512 уже пришло.

Для чего нужен AVX-512

Как и все предшественники, AVX-512 предназначен ускорить работу приложений, использующих мультимедийные инструкции для работы определенных алгоритмов. Например, AVX и AVX2 используются для ускорения конвертации видео, эмуляторов игровых приставок, работы некоторых инструментов в фото- и видеоредакторах, интеллектуального размытия фона в видеочатах, и т.д.

С массовым распространением AVX-512 многие из этих алгоритмов в течение нескольких лет получат и его поддержку. За счет более широких регистров новых инструкций, при должной оптимизации ПО, его работу можно будет заметно ускорить. Уже сегодня есть некоторое программное обеспечение, которое получает значительное ускорение от AVX-512, но пока его крайне мало. Например, эмулятор Play Station 3 под названием RPCS3 при его задействовании получает дополнительные 30% производительности. 

Заметного ускорения за счет новых инструкций уже сегодня можно добиться и при кодировании видео формата HEVC. Представители AMD говорят о том, что данные инструкции в первую очередь пригодятся для программного обеспечения, которое задействует глубокое обучение и искусственный интеллект, а также различные техники масштабирования изображений.

AVX-512 сегодня

При всех преимуществах AVX-512 стоит помнить, что в основной массе программного обеспечения поддержка новых инструкций всегда внедряется достаточно медленно. В том числе потому, что практически вся работа, которую позволяют ускорить инструкции, может быть сделана либо без них, либо на старых версиях вроде SSE4.2. Именно поэтому большая часть возможностей современного ПО полагается на мультимедийные инструкции старых версий. Взять в пример те же игры — до сих пор много случаев, когда на выходе игры разработчик заявляет об обязательных требованиях в виде процессора с AVX, а через некоторое время игра получает патч, который делает ее запуск возможным и на процессорах без него.

Почему так происходит? Дело в том, что для реального ускорения работы за счет мультимедийных инструкций нужно хорошо оптимизировать код программы под их определенную версию. Если этой оптимизации нет, то что с AVX, что с SSE4.2 та же игра покажет почти одинаковую производительность, и тогда требовать для запуска проекта процессора с AVX будет просто бессмысленно.

Такое до сих пор сплошь и рядом даже с AVX2, которому в этом году исполнилось 9 лет, не говоря уже о AVX-512, который пока не использует ни одна игра. Так что любителям компьютерных игр насчет отсутствия у их процессоров новых инструкций еще как минимум несколько лет беспокоиться не стоит.

Даже когда первые проекты получат поддержку новых инструкций, не стоит ждать от этих реализаций значительного буста производительности. Примером может служить выпущенная через два года после появления инструкций AVX игра GRID 2, которая имела два исполняемых файла, работающих с AVX и SSE. В итоге обе версии на одном и том же «железе» показывают практически идентичную производительность.

Долгий путь AVX-512 еще только начинается. Сейчас эти инструкции востребованы в основном в узкоспециализированном ПО. Через некоторое время они станут несколько более распространенными, но только через десяток лет станут использоваться повсеместно. Поэтому переживать о том, что ваш процессор их не поддерживает, пока смысла нет.

Показать полностью 9
Компьютерное железо Компьютер IT Инженер Технологии AMD Процессор Электроника Чип История развития Длиннопост
15
14
TechSavvyZone
TechSavvyZone

Завод Intel Hawthorn Farms: "Аллея славы" Intel Skulltrail экстремальный гейминг. Часть пятая⁠⁠

6 месяцев назад
Система AMD 4×4. Нажмите на картинку для увеличения.

Система AMD 4×4. Нажмите на картинку для увеличения.

AMD оказалась первой, представившей на настольный рынок двухпроцессорные системы в виде платформы 4×4. Intel, в свою очередь, первой выпустила на рынок четырёхъядерный процессор, намного обставив AMD по производительности на настольной арене. Чтобы компенсировать отставание, AMD решила установить на двухпроцессорную материнскую плату два двуядерных процессора. Для этого решения AMD взяла серверные процессоры Opteron, которые в то время работали всего на 200 МГц быстрее своих “собратьев”, и назвала систему от Athlon 64 FX70 до FX74. Слабым местом было то, что AMD пришлось разрабатывать для этого проекта совершенно новую и очень дорогую материнскую плату. Что ещё хуже, эта плата производилась только одной компанией. Сегодня эта платформа полностью предана забвению, AMD уже не поставляет процессоры 4×4.

С нынешним выпуском платформы Skulltrail Intel пошла по стопам AMD. Как материнская плата D5400XS Skulltrail, так и новые процессоры Core 2 Extreme QX9775 изначально планировались для сегмента рабочих станций и серверов.

Тестовая система Intel Skulltrail.

Систему нельзя назвать революционным шагом для пользователей. Скорее, это совокупность сравнительно дешёвого серверного процессора и специально разработанной и пугающе дорогой материнской платы. Intel предполагает, что пользователи настольных ПК будут раскупать платформу и в таком виде как горячие пирожки, поэтому компания, на наш взгляд, несколько обленилась и не разработала ничего нового. Мы уже видели подобный шаг и последствия на примере системы AMD 4×4. И та же судьба может ожидать и Intel Skulltrail. Как говорится, умный учится на чужих ошибках…

Тестовая конфигурация
Операционная система: Windows Vista Enterprise

Тестирование производилось на Windows Vista Enterprise. Хотя эту версию нельзя было просто так купить в магазине, её производительность идентична Windows Vista Business и Windows Vista Ultimate. Но нам пришлось использовать именно её, поскольку она поддерживает Open License. Эта лицензия позволяет активировать Windows Vista через Интернет много раз, а не звонить каждый раз на линию активации Microsoft.

Аппаратная конфигурация

Видеокарта: Foxconn nVidia GeForce 8800 GTX.

Видеокарта: Foxconn nVidia GeForce 8800 GTX.

Память: A-Data Vitesta 1066.

Память: A-Data Vitesta 1066.

Звуковая карта: Creative X-Fi Gamer.

Звуковая карта: Creative X-Fi Gamer.

Жёсткий диск: Western Digital Caviar SE 3200 AAJS.

Жёсткий диск: Western Digital Caviar SE 3200 AAJS.

Программная конфигурация

Заключение: технологически незрелая и без программной поддержки

Честно говоря, платформа Skulltrail нас разочаровала. Хотя мы протестировали бесчисленное количество продуктов от Intel, нам в руки ещё ни разу не попадалась столь “сырая” система. С другой стороны, такое заключение сделано на основе текущего состояния системы Skulltrail, хотя это официальный образец, который Intel высылала в качестве тестового образца. Но давайте повторюсь на дворе 2009 год и у Intel еще много свершений, как падений так и взлетов.

Показать полностью 8
Компьютерное железо Компьютер Инженер IT Технологии Тестирование Ностальгия Intel Раритет История развития Чип Электроника Материнская плата Длиннопост
1
15
TechSavvyZone
TechSavvyZone

Завод Intel Hawthorn Farms: "Аллея славы" Intel Skulltrail эксперименты и тестирование. Часть третья⁠⁠

6 месяцев назад

Самая высокая производительность получается, когда модули FB-DIMM работают в режиме “Interleave”.

FB-DIMM дешевле DDR3

На данный момент 1-Гбайт модули FB-DIMM стоят около $45, то есть в два раза дороже, чем DDR2. По сравнению с DDR3, с другой стороны, память на 60% дешевле. Большая часть памяти FB-DIMM, присутствующей на рынке, изготовлена компанией Kingston. В целом, ассортимент невелик.

Задержки памяти оказываются хуже, чем у обычной DDR2. 533-МГц FB-DIMM работают в режиме CL 4,0-4-4 , а 667-МГц – в 5,0-5-5. Тестовые образцы, которые в рознице не продаются, работают на частоте 800 МГц FB-DIMM от Kingston с задержками 5,0-5-5-15.

Модули использованные для тестирования на 667 МГц

В нашем распоряжении были и 667-МГц модули Qimonda, которые позволили протестировать четырёхканальную конфигурацию. Эти модули смогли заработать в режиме CL 4,0-4-4-12 (667 МГц) без каких-либо проблем.

Поскольку четырёхканальная конфигурация памяти оказалась намного быстрее по производительности записи, мы решили не проводить тесты на двухканальном режиме.

Высокое энергопотребление FB-DIMM и работа до 60°C

Модули FB-DIMM потребляют в 2,36 раза больше энергии, чем память DDR2.

В своей документации Intel рекомендует оснащать модули активной системой охлаждения. Однако в комплект поставки нашей системы кулер для памяти не входил, и мы не очень представляем себе, как Intel подразумевает его монтировать.

Intel, надо сказать, права. После измерения температуры модулей FB-DIMM – она составила почти 60°C!

Платформа Skulltrail

Процессоры: Intel Core 2 Extreme QX9775

Материнская плата Skulltrail была разработана для использования двух процессоров Core 2 Extreme QX9775. Эти два процессора из линейки Extreme Edition, в основном, идентичны 45-нм четырёхъядерному Penryn, который уже продаётся.

Intel объявила о процессорах Penryn, в октябре 2007 года. Технологически QX9775 полностью идентичен модели Core 2 Extreme QX9770, которую Intel представила в 2009 году. Однако Intel была вынуждена отложить поставки процессора на несколько месяцев из-за ошибки, обнаруженной в ядре CPU.

Поскольку процессор Core 2 Extreme QX9775 основан на том же степпинге C0, как и QX9770, подозреваем, что у него присутствует та же самая ошибка. Впрочем, ошибка проявляется только на очень высоких частотах.

QX9775 в деталях

Процессор Skulltrail Core 2 Extreme QX9775 работает на частоте 3,2 ГГц, и каждое из двух ядер содержит 6 Мбайт кэша L2, что даёт 12 Мбайт на процессор. Связь с северным мостом 5400 осуществляется через 400-МГц шину (1600QDR), а поскольку перед нами модель Extreme Edition, то множитель разблокирован.

Единственное отличие между настольным однопроцессорным вариантом и версией для двух сокетов внешне можно обнаружить только по маркировке.

Материнская плата для Intel Skulltrail, а именно – D5400XS, оснащена двумя сокетами LGA 771, которые используются в сегменте серверов и рабочих станций. В итоге она несовместима с настольными процессорами, которые используют Socket 775. Собственно, два выреза на упаковке процессора и не позволяют установить неверный CPU. Электрически два варианта совместимы, поскольку они используют один и тот же протокол FSB.

Использование Socket 771 на материнской плате Skulltrail даёт существенное преимущество для покупателя – она совместима с любым современным процессором Xeon. По информации Intel, поддерживаются все модели Xeon, включая 65-нм (Clovertown) и 45-нм (Harpertown).

Поддержка до 43 моделей Xeon

Благодаря неограниченной поддержке всех процессоров Socket 771, вы можете использовать не только Core 2 Extreme QX9775, но и все 43 модели Xeon.

в 2009 году Intel продаёт 21 четырёхъядерную и 21 двуядерную модели. Устанавливать на плату Skulltrail двуядерные Xeon вряд ли имеет смысл, поскольку данная система изначально предназначалась для установки восьми ядер. Если вы не хотите строить систему на двух четырёхъядерных процессорах, то намного легче выбрать обычную настольную материнскую плату и установить стандартный четырёхъядерный процессор, это будет ощутимо дешевле, да и такой вариант обеспечит более высокую производительность.

Из-за большого выбора процессоров Xeon и хорошего потенциала материнской платы D5400XS для разгона покупатели могли собрать более дешёвую 8-ядерную систему, чем изначально предлагает Intel. “Младшие” четырёхъядерные процессоры Xeon E5310 (1,6 ГГц, 6 Мбайт кэша L2) стоят от $270 (186 евро в Европе). Между тем, 12-Мбайт версия четырёхъядерного E5405 на частоте 2,00 ГГц стоит от $630 в России (205 евро в Европе), УВЫ.

Благодаря хорошему потенциалу материнской платы D5400XS по разгону, вы могли построить относительно недорогую и быструю 8-ядерную систему на двух “младших” моделях Xeon.

В следующей таблице перечислены процессоры, доступные для Socket 771.

BIOS: нет настройки частоты памяти

Если заглянуть в BIOS, то сразу же станет понятна направленность материнской платы Intel Skulltrail на оверклокеров. В ней есть практически все опции, которые могут когда-либо понадобиться оверклокеру. За исключением одной. По какой-то странной причине в BIOS нельзя менять частоту работы памяти.

Если вы установите процессор Xeon, у которого не разблокирован множитель, то вам наверняка не понравится отсутствие нужных настроек, помогающих при разгоне процессора через FSB. Возможности изменить частоту памяти нет, поэтому она может быстро достичь своего предела. Минимальные задержки, которые есть в BIOS, – CL 6,0-6-6-18. Из-за отсутствия настроек памяти потенциал разгона будет существенно ограничен.

В разделе “Performance” – “Processor Overrides” BIOS позволяет поднимать напряжение каждого процессора, а также уровень сигнала шины FSB. Есть возможность менять множитель процессора и частоту FSB.

В разделе “Performance” – “Memory Overrides” можно задавать задержки и напряжения модулей памяти. Snoop-фильтр гарантирует, что подключение FSB к CPU будет использоваться наиболее эффективно.

Тестовая материнская плата использовала BIOS версии XS54010J.86A.0780.2008.0110.1956, которая ещё находится в стадии разработки (бета-версия). Когда мы получили плату изначально, у неё была установлена альфа-версия BIOS.

BIOS работает очень медленно, на прохождение теста POST требуется до 48 секунд. При разгоне такое поведение системы не очень-то радует. Вообще, несколько необычно получать от Intel бета-версии BIOS.

Также были обнаружены проблемы, при попытке обновить BIOS. Программа обновления BIOS под Windows, которая поставлялась с материнской платой, отказалась работать. Поэтому мы создали загрузочный USB-флешку (у платы нет интерфейса для дисковода) и использовали программу прошивки от материнской платы Intel D975BX2, которая позволила нам выполнить обновление. В данном состоянии BIOS не готова для энтузиастов или оверклокеров. Нас шокировало, что BIOS материнской платы Skulltrail содержит столь большое количество ошибок.

Разгон: 12,5% до 3,60 ГГц

Штатная частота Core 2 Extreme QX9775 составляет 3,20 ГГц. В BIOS есть опция изменения множителя, однако она относится одновременно к обоим процессорам, то есть разгоняются они одновременно. Выбирать отдельный множитель для каждого из процессоров не получается, поэтому успешный разгон будет зависеть от самого “слабого” CPU. Если верить статистике, то вероятность хорошего разгона в данном случае будет ниже, чем у однопроцессорной системы. Увеличив множитель с 8x до 9x, мы повысили частоту CPU до 3,60 ГГц.

В виду ограничения фотоматериалов

ПРОДОЛЖЕНИЕ СЛЕДУЕТ...

Показать полностью 25
Технологии Инженер IT Компьютерное железо Компьютер Intel Материнская плата Электроника История развития Производство Ностальгия Раритет Программа Чип Длиннопост
0
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии