Please enable JavaScript.
Coggle requires JavaScript to display documents.
profile - Coggle Diagram
profile
op_profiler.py
-
get_prof_tasks_by_rank(all_prof_tasks, args.prof_num_nodes, args.prof_node_rank):将分析任务均匀分配到所有节点,按时间比例分配任务,确保各节点耗时接近。
-
-
comm_profiler.py
对于每个{model, size}对执行run_profile(prof_task)。
run_profile(prof_task)根据任务获取模型配置,包括数据大小、数据类型等。从文件中读取激活值和输出的大小,构建数据大小列表,并调用torch.multiprocessing.spawn()启动多个进程来执行run()函数。
-