2.3. Наиболее вероятным фактором, который мог стать первопричиной двойного «рестарта», является локальное воздействие тяжелых заряженных частиц (ТЗЧ) космического пространства, которое привело к сбою в ОЗУ вычислительных модулей комплектов ЦВМ22 во время полёта на втором витке КА «Фобос-Грунт».
Сбой ОЗУ мог быть вызван кратковременной неработоспособностью ЭРИ вследствие воздействия ТЗЧ на ячейки вычислительных модулей ЦВМ22, которые содержат две микросхемы одного типа WS512K32V20G24M (ячейки вычислительных модулей располагаются в едином корпусе параллельно друг другу). Воздействие привело к искажению программного кода и срабатыванию «сторожевого» таймера, что стало причиной «рестарта» обоих полукомплектов ЦВМ22. Модель подобного взаимодействия ТЗЧ с ЭКБ не регламентирована нормативно-техническими документами. Комиссия считает необходимым разработать и внедрить в организациях РКП нормативно-технические документы, содержащие современные модели ионизирующих излучений космического пространства и руководства по их использованию.
На волне всеобщего раздражения, вызванного регулярными неудачами, в последнее время, в российской космической программе, приходилось слышать даже уж совсем обидные и нелепые слухи, о том, что, якобы, в Фобосе использовалась ширпотребная «китайская» электроника, вот она-де, и подвела. На самом деле это не так.
Вот что пишет о указанной микросхеме в своем блоге Джеймс Гамильтон, в статье о влиянии сбоев в памяти на работу серверного оборудования:
These SRAMS are manufactured by White Electronic Design and the model number can be decoded as “W” for White Electronic Design, “S” for SRAM, “512K32” for a 512k memory by 32 bit wide access, “V” is the improvement mark, “20” for 20ns memory access time, “G24” is the package type, and “M” indicates it is a military grade part.
«Это SRAM (Static RAM, микросхема памяти, ячейка которой, в отличие от привычной по персональным компьютерам DRAM — Dynamic RAM, сохраняет свое состояние при отсутствии обращения и не требует „регенерации“, широко применяется в промышленной электронике) произведена компаний White Electronic Design (»W"), имеет организацию StaticRAM («S»), «512K32» означает 512Kслов разрядностью 32 бита. «V» отметка улучшенных характеристик, «20» — 20ns время доступа к ячейке памяти, «G24» — тип корпуса, «M» — указывает на «военный» класс изготовления и допусков."
Налицо классическая проблема недостаточной конструктивной проработки, а если взять шире, то, по-видимому, низкой инженерной компетенции в целом. Конечно спроектировать такое расположение двух плат БВК, чтобы микросхемы памяти в них была расположены так близко, что прошивались-бы одной частицей, и вызывали (одновременный!) сбой сразу обоих сдублированных компьютеров, это уже явная конструктивная недоработка «верхнего уровня».
«Недавнее тестирование монолитных чипов SRAM емкостью 1M и 4M, проведенное в Брукхейвенской Национальной Лаборатории, показало их крайнюю чувствительность к эффекту „защелкивания“. Мы наблюдали этот эффект при воздействии по меньшей мере доступных на ускорителе в Брукхейвене тяжелых ионов, энергией 0,375МэВ-см2/мг.»
Источник
http://ieeexplore.ieee.org/xpl/freeabs_ ... er=1532657 А ведь это те самые микросхемы, которые выбрали в Техкоме для создания ЦВМ22! И известно об этом их поведении было еще, по меньшей мере, с 2005 года.
Почему только 2 блока? В самолетах же как правило по 3 ставят.Впрочем, использование микросхемы, про которую уже лет пять всем читающим профильные сборники IEEE должно быть известно, что они непригодны для использования в радиационно-жестких условиях космоса, это уже, как раз, некомпетентность. Или невладение английским, что тоже нередко встречается.http://habrahabr.ru/post/139819/Надежность одной системы — да, ненадежности перемножаются. Но дублирование и прочее резервирование — это параллельные системы, их перемножать не нужно, т.к. они не в одной цепи. Вот понятная аналогия — у нас два глаза, каждый из которых легко повредить, но лишиться сразу двух глаз труднее, чем одного. Один выколотый глаз может быть «напоролся на ветку», но два выколотых глаза — это уже результат чьего-то злого умысла. Так и с космосом: один вырубившийся выч.модуль может быть случайностью «шальная пуля»,
а два вырубившихся одновременно модуля — это хуже, это где-то серьезная ошибка