/* * Copyright (c) Meta Platforms, Inc. and affiliates. * All rights reserved. * * This source code is licensed under the BSD-style license found in the * LICENSE file in the root directory of this source tree. */ #include #include #include #include #include #include namespace vkcompute { void add_split_with_sizes_default_node( ComputeGraph& graph, ValueRef in, const std::vector& split_sizes, int64_t dim, ValueRef out_list_ref) { vTensorPtr t_in = graph.get_tensor(in); VK_CHECK_COND(check_packed_dim_is(*t_in, WHCN::kChannelsDim)); ValueListPtr out_list = graph.get_value_list(out_list_ref); DimIndex dim_index = normalize_to_dim_index(*t_in, dim); VK_CHECK_COND(out_list->size() == split_sizes.size()); for (int split_idx = 0; split_idx < split_sizes.size(); split_idx++) { int64_t split_size = split_sizes[split_idx]; ValueRef out_ref = (*out_list)[split_idx]; vTensorPtr t_out = graph.get_tensor(out_ref); VK_CHECK_COND(check_packed_dim_is(*t_out, WHCN::kChannelsDim)); VK_CHECK_COND(dim_at(*t_out, dim_index) == split_size); } if (dim_index == kWidth4D) { utils::ivec3 src_offset = utils::make_ivec3({0, 0, 0}, false); utils::ivec3 dst_offset = utils::make_ivec3({0, 0, 0}, false); for (ValueRef out_ref : *out_list) { // Doesn't need to use split_size since we have already verified that the // output tensor's size matches with the split_size. vTensorPtr t_out = graph.get_tensor(out_ref); utils::ivec3 range = t_out->logical_limits(); add_copy_offset_node(graph, in, range, src_offset, dst_offset, out_ref); src_offset[0] += range[0]; } } else if (dim_index == kHeight4D) { utils::ivec3 src_offset = utils::make_ivec3({0, 0, 0}, false); utils::ivec3 dst_offset = utils::make_ivec3({0, 0, 0}, false); for (ValueRef out_ref : *out_list) { vTensorPtr t_out = graph.get_tensor(out_ref); utils::ivec3 range = t_out->logical_limits(); add_copy_offset_node(graph, in, range, src_offset, dst_offset, out_ref); src_offset[1] += range[1]; } } else if (dim_index == kBatch4D) { utils::ivec3 src_offset = utils::make_ivec3({0, 0, 0}, false); utils::ivec3 dst_offset = utils::make_ivec3({0, 0, 0}, false); for (ValueRef out_ref : *out_list) { vTensorPtr t_out = graph.get_tensor(out_ref); utils::ivec3 range = t_out->logical_limits(); add_copy_offset_node(graph, in, range, src_offset, dst_offset, out_ref); src_offset[2] += range[2]; } } else if (dim_index == kChannel4D) { int32_t src_offset = 0; int32_t dst_offset = 0; for (ValueRef out_ref : *out_list) { vTensorPtr t_out = graph.get_tensor(out_ref); int32_t range = dim_at(t_out->sizes()); add_copy_channel_offset_node( graph, in, range, src_offset, dst_offset, out_ref); src_offset += range; } } else { VK_THROW("not ipmlemented"); } } void add_split_with_sizes_default_node( ComputeGraph& graph, ValueRef in, ValueRef split_sizes_ref, ValueRef dim_ref, ValueRef out) { int64_t dim = graph.extract_scalar(dim_ref); std::vector split_sizes = *(graph.get_int_list(split_sizes_ref)); add_split_with_sizes_default_node(graph, in, split_sizes, dim, out); } void split_with_sizes_copy_default( ComputeGraph& graph, const std::vector& args) { add_split_with_sizes_default_node(graph, args[0], args[1], args[2], args[3]); } void add_split_tensor_node( ComputeGraph& graph, ValueRef in, ValueRef split_size_ref, ValueRef dim_ref, ValueRef out) { int64_t split_size = graph.extract_scalar(split_size_ref); int64_t dim = graph.extract_scalar(dim_ref); vTensorPtr t_in = graph.get_tensor(in); DimIndex dim_index = normalize_to_dim_index(*t_in, dim); int64_t size = dim_at(*t_in, dim_index); std::vector split_sizes(size / split_size, split_size); add_split_with_sizes_default_node(graph, in, split_sizes, dim, out); } void split_tensor(ComputeGraph& graph, const std::vector& args) { add_split_tensor_node(graph, args[0], args[1], args[2], args[3]); } REGISTER_OPERATORS { VK_REGISTER_OP( aten.split_with_sizes_copy.default, split_with_sizes_copy_default); VK_REGISTER_OP(aten.split.Tensor, split_tensor); } } // namespace vkcompute