Вы здесь
В Китае разработан первый в мире чип тензорного процессора на основе углеродных нанотрубок
Искусственный интеллект (ИИ) и инструменты машинного обучения доказали свою высокую эффективность в решении различных задач, связанных с анализом данных и составлением точных прогнозов. Несмотря на свои преимущества, эти инструменты имеют значительные вычислительные требования, и при работе на существующих процессорах они могут потреблять много энергии.
Исследователи из Пекинского университета и других институтов Китая недавно разработали многообещающий тензорный процессор (TPU) на основе углеродных нанотрубок (CNT), который можно использовать для более энергоэффективного запуска алгоритмов ИИ. Этот чип, представленный в статье в Nature Electronics, может стать ключевым прорывом на пути к разработке чипов следующего поколения.
«Мы успешно разработали первый в мире чип тензорного процессора (TPU) на основе углеродных нанотрубок», — рассказал Чжиюн Чжан, соавтор статьи. «Мы были вдохновлены быстрой разработкой приложений ИИ, а также TPU от Google. От ChatGPT до Sora искусственный интеллект открывает новую революцию, но традиционная технология полупроводников на основе кремния больше не может удовлетворить потребности в обработке огромных объемов данных. Мы нашли решение перед лицом этой глобальной проблемы».
В информатике систолические массивы — это сети процессоров, которые ритмично вычисляют данные и позволяют им свободно проходить через них, подобно тому, как кровь течет по человеческому телу. Чжан и его коллеги разработали новую эффективную архитектуру систолического массива, используя транзисторы на основе углеродных нанотрубок, полевые транзисторы (FET) с каналами из углеродных нанотрубок вместо обычных полупроводников. Основываясь на этой новой архитектуре, которую они разработали, они создали первый в мире TPU на основе углеродных нанотрубок.
«Чип состоит из 3000 полевых транзисторов на основе углеродных нанотрубок, организованных в виде 3*3 процессорных блоков (PE), — пояснил Чжан. — Эти 9 PE образуют архитектуру систолического массива, которая может выполнять операции свертки двухбитных целых чисел и умножения матриц параллельно».
Тесно связанная архитектура, представленная Чжаном и его коллегами, поддерживает поток систолических входных данных. Этот поток данных через архитектуру сокращает операции чтения и записи компонентов статической памяти с произвольным доступом, что приводит к значительной экономии энергии.
«Каждый PE получает данные от своих соседей по восходящему потоку (вверху и слева), независимо вычисляет частичный результат внутри себя и передает его вниз по течению (вправо и вниз)», — сказал Чжан. «Каждый PE разработан для 2-битных MAC и умножения матриц на знаковых и беззнаковых целых числах. В сочетании с систолическим потоком данных CNT TPU может ускорить операции свертки в приложениях ИИ».
Предложенная командой архитектура системы была тщательно спроектирована для ускорения тензорных операций, выполняемых искусственными нейронными сетями, легко переключаясь между целочисленными свертками и умножениями матриц. Разработанный ими на основе этой архитектуры чип тензорной обработки может стать важной вехой в разработке новых высокопроизводительных интегральных схем на основе низкоразмерной электроники.
«На основе нашего тензорного процессорного чипа на основе углерода мы создали пятислойную сверточную нейронную сеть, которая может выполнять задачи распознавания изображений с точностью до 88% и энергопотреблением всего 295 мкВт, что является самым низким энергопотреблением среди всех новых аппаратных технологий сверточного ускорения», — сказал Чжан.
«Результаты моделирования системы показывают, что транзистор на основе углерода, использующий технологический узел 180 нм, может достигать 850 МГц, а энергоэффективность превышает 1TOPS/Вт, что демонстрирует очевидные преимущества по сравнению с другими технологиями устройств на том же технологическом узле».
В целом, результаты первоначальных симуляций и тестов, проведенных исследователями, подчеркивают потенциал их TPU на основе углерода, предполагая, что он может хорошо подойти для запуска вычислительных моделей на основе машинного обучения. В будущем их чип может демонстрировать большую вычислительную мощность и быть более энергоэффективным, чем существующие устройства на основе полупроводников.
Усилия этой исследовательской группы в конечном итоге могут помочь ускорить операции сверточных нейронных сетей, одновременно снижая их энергопотребление. В то же время Чжан и его коллеги планируют дополнительно повысить производительность, энергоэффективность и масштабируемость своего чипа.
«Производительность и энергоэффективность этого подхода можно дополнительно повысить, например, за счет использования выровненных полупроводниковых CNT в качестве материалов каналов, уменьшения размера транзистора, увеличения разрядности прецессорных элементов или внедрения КМОП-логики», — добавил Чжан. «CNT TPU также потенциально может быть построен в BEOL на кремниевой фабрике для трехмерной интеграции: то есть, кремниевый CPU внизу с CNT TPU сверху в качестве сопроцессора. Более того, можно изучить 3D монолитную интеграцию многослойных CNT FET для потенциальных преимуществ снижения задержки и увеличения пропускной способности».
На иллюстрации: изображение процессорного блока, полученное с помощью сканирующего электронного микроскопа