Гены человека переименованы в «Пожалуйста, Excel»


Более двух десятков человеческих генов были переименованы, чтобы их можно было ввести в электронную таблицу без форматирования в виде дат. Новые рекомендации по стандартизированному именованию генов явно позволяют переименовывать гены, чтобы избежать проблем с обработкой данных.

В геноме человека есть десятки тысяч уникальных генов — первоначально предполагалось, что их число превышает 100 000, но впоследствии это число было уменьшено. Присвоение каждому отдельному гену значимого имени считается важным для облегчения эффективного взаимодействия, и тот факт, что некоторые гены пришлось переименовать из-за Excel, привлек большое внимание.

Первоначально эта история была опубликована в The Verge, о чем предупредил твит, который привлек внимание к этому отрывку из недавно опубликованного Руководства по номенклатуре генов человека:

The Verge описала проблему с:

когда пользователь вводит буквенно-цифровой символ гена в электронную таблицу, например MARCH1 — сокращение от «Membrane Associated Ring-CH-Type Finger 1» — Excel преобразует это в дату: 1 марта. Это крайне неприятные, даже опасные, искажающие данные, которые ученым приходится вручную разбирать, чтобы восстановить. Это также удивительно широко распространено и затрагивает даже рецензируемые научные работы. Одно исследование, проведенное в 2016 году, изучило генетические данные, опубликованные вместе с 3597 опубликованными статьями, и обнаружило, что примерно на одну пятую повлияли ошибки Excel.

Эльзепет Бруфорд, координатор комитета по номенклатуре генов HUGO, рассказала The Verge, что до сих пор названия около 27 генов были изменены, и она отметила, что, несмотря на некоторое разногласие по поводу этого решения, было легче переименовать гены человека, чем его. было изменить принцип работы Excel.

Фактически, HGNC изначально пытался изменить способ использования Excel генетиками, а в прошлом году разместил на YouTube видео, в котором показано, как вводить данные в Excel, чтобы избежать преобразования названий генов в даты:

Итак, меняя имена генов, генетики теперь уступают, когда им следует просить Microsoft исправить проблемы с форматированием даты, которые также раздражают другие группы пользователей?

Как среди тех, кто комментирует статью в Verge, так и на связанных с ней Hacker News, единодушное мнение заключается в том, что удаление имен, содержащих даты, является разумным шагом. Это связано с тем, что Excel — это полезный инструмент для работы с данными для ученых всех дисциплин, и хотя автоформатирование Excel можно «приручить», это не является надежным, особенно если вы хотите поделиться электронными таблицами с другими пользователями, у которых есть собственное форматирование. параметры.

Нам кажется, что это самый большой случай виляния хвостом собаки, с которым мы сталкивались за какое-то время. Я заставляю вас задаться вопросом, что бы произошло, если бы Excel обладал такой силой в прежние времена? Возможно, e = mc2 было бы E1 = M1 * C1 * C1, или кварк мог бы быть автокорректирован до кварты.


Добавить комментарий