//Без Комментариев — Оценивая Авторство Кода, Git Обвиняет Кого? & Случай OpenStack


•  Оценка авторства кода: Случай ядра Linux

• Кто Виноват В Этом? Стилистическое авторство Атрибуция небольших, неполных фрагментов исходного кода

• Сотрудничество между конкурентами на арене с открытым исходным кодом: Случай OpenStack

Иногда новости достаточно хорошо освещаются в других местах, и нам мало что остается добавить, кроме как довести их до вашего сведения.

Без комментариев-это формат, в котором мы представляем исходную исходную информацию, слегка отредактированную, чтобы вы могли решить, хотите ли вы следить за ней. 

Кто что написал? Это важный вопрос, хотя бы для того, чтобы убедиться, что мы можем соответствующим образом распределить вину! У нас есть два новых исследования, посвященных тому, кто что написал, и еще одно, посвященное тому, как компании сотрудничают в проекте с открытым исходным кодом.

Первый дает некоторое представление о том, кто и что делает в проекте ядра Linux, и это рассматривается как типичный проект с открытым исходным кодом. Второй демонстрирует, что вы можете идентифицировать программиста по фрагменту кода, который имеет некоторые тревожные последствия. Третий дает большое представление о проекте OpenStack. 

Оценка авторства кода: Случай ядра Linux

Авторство кода является ключевой информацией в крупномасштабных системах с открытым исходным кодом. Среди прочего, он позволяет сопровождающим оценить разделение работы и определить ключевых сотрудников.

Интересно, что в сообществах с открытым исходным кодом отсутствуют рекомендации по управлению авторством. Это может быть смягчено путем создания эмпирического массива знаний о том, как меры, связанные с авторством, развиваются в успешных сообществах с открытым исходным кодом.

В этом направлении мы проведем тематическое исследование ядра Linux. Наши результаты показывают, что:

(а) лишь небольшая часть разработчиков (26 %) вносит значительный вклад в базу кода;

(b) распределение количества файлов на одного автора сильно искажено-небольшая группа ведущих авторов (3 %) отвечает за сотни файлов, в то время как большинство авторов (75 %) отвечают не более чем за 11 файлов;

(c) большинство авторов (62 %) имеют специализированный профиль;

(d) авторы с большим количеством связей в соавторстве, как правило, сотрудничают с другими, у которых меньше связей.

Мерзавец, Кого Винить? Стилистическое авторство Атрибуция небольших, неполных фрагментов исходного кода

Присвоение авторства программ имеет последствия для конфиденциальности программистов, которые хотят вносить свой код анонимно. В то время как предыдущая работа показала, что полные файлы, созданные индивидуально, могут быть отнесены, мы впервые показываем здесь, что учетные записи, принадлежащие участникам с открытым исходным кодом, содержащие короткие, неполные и, как правило, не компилируемые фрагменты, также могут быть эффективно отнесены. 

Мы предлагаем метод определения авторства учетных записей участников, содержащих небольшие образцы исходного кода, такие как те, которые могут быть получены из систем контроля версий или другого прямого сравнения последовательных версий. Мы показываем, что, хотя применение предыдущих методов к отдельным небольшим образцам исходного кода дает точность около 73% для 106 программистов в качестве базовой линии, путем объединения и усреднения вероятностей классификации достаточно большого набора образцов, принадлежащих одному и тому же автору, мы достигаем точности 99% для назначения набора образцов правильному автору.

С помощью этих результатов мы демонстрируем, что атрибуция является важной угрозой конфиденциальности для программистов даже в реальных средах совместной работы, таких как GitHub. Кроме того, мы предлагаем использовать калибровочные кривые для идентификации образцов неизвестными и ранее неизвестными авторами в условиях открытого мира. Мы показываем, что мы также можем использовать эти калибровочные кривые в том случае, если у нас нет информации о связывании и, следовательно, мы вынуждены классифицировать отдельные образцы напрямую. Это связано с тем, что калибровочные кривые позволяют нам определить, какие образцы с большей вероятностью были правильно отнесены. Использование такой кривой может помочь аналитику выбрать точку отсечения, которая предотвратит большинство неправильных классификаций, ценой отказа от некоторых из наиболее сомнительных правильных атрибуций.

Сотрудничество между конкурентами на арене с открытым исходным кодом: случай OpenStack

Межорганизационные взаимодействия часто сложны и парадоксальны. В этом исследовании мы преодолеваем два парадокса управления: конкуренция против сотрудничества и разработка технологий с открытым исходным кодом против разработки запатентованных технологий.

Мы следуем экосистеме с открытым исходным кодом OpenStack, где конкурирующие фирмы сотрудничают в совместной разработке облачной инфраструктуры для больших данных. Мы предлагаем повествование, дополненное визуализациями социальных сетей, которое описывает эволюцию сотрудничества и конкуренции.

Наши результаты показывают, что прозрачность развития и слабые права интеллектуальной собственности (т. Е. Характеристики экосистем с открытым исходным кодом) позволяют координационной фирме легче передавать информацию и ресурсы между несколькими альянсами.


Добавить комментарий