![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Исследование возможности работы с имеющимся графом зависимостей по данным, в частности, на основе собираемой (заранее собранной) статистики по запускам программы (если она имеется).
Утилита parser в процессе своей работы так или иначе строит дерево программы, листьями которого являются операторы программы, а узлами — блоки, которые состоят из своих сыновей. Также, parser поверх этого дерева строит граф зависимостей по данным, где уже строятся связи между блоками одного уровня (если такого не происходит, то эту функциональность легко добавить, как следует из диссертации). Идея состоит в том, чтобы использовать имеющееся дерево для изменения того графа зависимостей, по которому будет генерироваться программа, в частности, с целью её оптимизации. Также, если есть статистика исполнения программы, сгенерированной на основе подобного графа с дополнительной информацией в виде дерева блоков и операторов, то возможно исследование возможностей оптимизации графа путём разбиения и слияния его узлов (слияние возможно и без наличия дополнительно информации), в частности, с применением генетических алгоритмов (что потребует огромное количество запусков, но, тем не менее, может привести к графу зависимостей, близкому к оптимальному).
Также планируется создать некий UI, который позволял бы проделывать операции слияния-разделения вершин графа вручную, а также осуществлять мониторинг процесса оптимизации и просмотр собранной статистики. Вероятно, в целях переносимости, данный UI будет реализован на языке Java.
Кроме того, возможно исследование возможностей добавления к утилите parser возможности генерации результирующих графов зависимостей по данным (то есть тех графов, которые будут использоваться для генерации параллельной программы), вершины которых будут состоять из вычислительно тяжёлых блоков, а не из отдельных операторов (опять же, возможно исследование применимости в данной области генетических алгоритмов, которые будут опираться не на статистику запусков (что логично делать во время оптимизации), а на тесты процессоров и коммуникационной среды целевой подсистемы).
Данное исследование может быть ценно как для того класса программ, который планируется запускать неоднократно (как генерация графа, так и его оптимизация), так и для программ, которые планируется запускать небольшое количество раз (только генерация, оптимизация подразумевает статистику, которая будет собираться во время неоднократного запуска, что сводит в данном случае на нет её эффективность) — для них логично провести исследование критериев генерации графов, близких к оптимальным.
Буду очень рад, если Вы это прочитаете и особенно, если скажете, что тут Вам было непонятно. Это для меня важно.