База знаний по Open Source
Авторизация
Поиск по базе знаний

Технология S.M.A.R.TТехнология S.M.A.R.T. – Self-Monitoring, Analysis and Reporting Technology или Технология Самодиагностики, Анализа и Отчета.

S.M.A.R.T. позволяет отслеживать и предсказывать возникновение ошибок, связанных с функционированием HDD и реализована как набор программ, вшитых в микрокод винчестера. Каждая фирма-производитель дисков ведет свои разработки реализации этой технологии, отсюда и разнообразие параметров для разных дисков. Однако существуют общие параметры:

  1. Атрибуты, отражающие общее состояние диска (примерно 30);
  2. Внутренние тесты (self-tests);
  3. Журналы S.M.A.R.T. (ошибок, общего состояния, дефектных секторов и т.п.).

Полный обязательный перечень S.M.A.R.T атрибутов описан в стандарте ATA/ATAPI-6. Атрибуты S.M.A.R.T. – особые характеристики, которые используются при анализе состояния и запаса живучести накопителя. Они выбираются производителем, основываясь на их способности предсказывать ухудшение рабочих характеристик накопителя или определить его неработоспособность.

Основные общие атрибуты S.M.A.R.T из стандарта ATA/ATAPI-6:

  • Raw Read Error Rate – Частота появления ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя.
  • Throughput Performance – Средняя производительность (пропускная способность) диска. Уменьшение значения value этого атрибута с большой вероятностью указывает на проблемы в накопителе.
  • Spin Up Time– Время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 RPM до рабочей скорости.
  • Start/Stop Count– Количество циклов запуск/останов шпинделя. Хранит общее количество включений/выключений диска.
  • Reallocated Sectors Count – Количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации, он пытается переместить данные в специальную резервную область (spare area) и, в случае успеха, помечает сектор как “переназначенный”. Также, этот процесс называют remapping, а переназначенный сектор – remap. Благодаря этой возможности, на современных жестких дисках очень редко видны (при тестировании поверхности) так называемые bad block. Однако, при большом количестве ремапов, на графике чтения с поверхности будут заметны “провалы” – резкое падение скорости чтения (до 10% и более).
  • Seek Error Rate – Частота появления ошибок позиционирования МГ (магнитной головки). В случае сбоя в механической системе позиционирования, повреждения сервометок (servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше, тем хуже состояние механики и/или поверхности жесткого диска.
  • Seek Time Performance – Средняя производительность операций позиционирования МГ. Данный параметр показывает среднюю скорость позиционирования привода МГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода.
  • Power-On Hours – Количество отработанных часов во включенном состоянии. Значение value этого атрибута показывает количество часов (минут, секунд – в зависимости от производителя), отработанных жестким диском. Снижение значения атрибута до критического уровня (threshold) указывает на выработку диском ресурса. На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать.
  • Spin Retry Count – Количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхода на рабочую скорость, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
  • Recalibration Retries– Количество повторов попыток рекалибровки накопителя. Данный атрибут фиксирует общее количество попыток сброса состояния накопителя и установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
  • Device Power Cycle Count – Количество полных циклов запуска/останова жесткого диска.
  • Soft Read Error Rate – Частота появления “программных” ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя.
  • Load/Unload Cycle Count – Количество циклов вывода МГ в специальную парковочную зону/в рабочее положение.
  • Temperature – Температура. Данный параметр отражает показание встроенного температурного сенсора в градусах Цельсия.
  • Reallocation Event Count – Количество операций переназначения (ремаппинга). Показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции.
  • Current Pending Sector Count – Текущее количество нестабильных секторов. Показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped).
  • Uncorrectable Sector Count – Количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора, которые не удалось скорректировать. Рост значения в поле raw value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя.
  • UltraDMA CRC Error Count – Общее количество ошибок CRC в режиме UltraDMA, содержит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC – Interface CRC). В большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.3 MHz), сильно перекрученом кабеле, а также – по вине драйверов ОС, которые не соблюдают требований к передачи/приему данных в режимах UltraDMA.
  • Write Error Rate – Частота появления ошибок при записи данных. Показывает общее количество ошибок, обнаруженных во время записи сектора. Чем ниже значение value, тем хуже состояние поверхности диска и/или механики привода.
  • Disk Shift – Сдвиг пакета дисков относительно оси шпинделя.
  • G-Sense Error Rate – Частота появления ошибок в результате ударных нагрузок. Данный атрибут хранит показания ударочувствительного сенсора – общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, неправильной установке, и т.п.).

Для работы со SMART в Linux Ubuntu/Mint существует несколько пакетов, но самый популярный и развитый пакет smartmontools, который входит в стандартные репозитории систем.