/*------------------------------------------------------------------------- * drawElements Quality Program Reference Renderer * ----------------------------------------------- * * Copyright 2014 The Android Open Source Project * * Licensed under the Apache License, Version 2.0 (the "License"); * you may not use this file except in compliance with the License. * You may obtain a copy of the License at * * http://www.apache.org/licenses/LICENSE-2.0 * * Unless required by applicable law or agreed to in writing, software * distributed under the License is distributed on an "AS IS" BASIS, * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. * See the License for the specific language governing permissions and * limitations under the License. * *//*! * \file * \brief Reference renderer interface. *//*--------------------------------------------------------------------*/ #include "rrRenderer.hpp" #include "tcuVectorUtil.hpp" #include "tcuTextureUtil.hpp" #include "tcuFloat.hpp" #include "rrPrimitiveAssembler.hpp" #include "rrFragmentOperations.hpp" #include "rrRasterizer.hpp" #include "deMemory.h" #include #include namespace rr { namespace { typedef double ClipFloat; // floating point type used in clipping typedef tcu::Vector ClipVec4; struct RasterizationInternalBuffers { std::vector fragmentPackets; std::vector shaderOutputs; std::vector shaderOutputsSrc1; std::vector shadedFragments; float *fragmentDepthBuffer; }; uint32_t readIndexArray(const IndexType type, const void *ptr, size_t ndx) { switch (type) { case INDEXTYPE_UINT8: return ((const uint8_t *)ptr)[ndx]; case INDEXTYPE_UINT16: { uint16_t retVal; deMemcpy(&retVal, (const uint8_t *)ptr + ndx * sizeof(uint16_t), sizeof(uint16_t)); return retVal; } case INDEXTYPE_UINT32: { uint32_t retVal; deMemcpy(&retVal, (const uint8_t *)ptr + ndx * sizeof(uint32_t), sizeof(uint32_t)); return retVal; } default: DE_ASSERT(false); return 0; } } tcu::IVec4 getBufferSize(const rr::MultisampleConstPixelBufferAccess &multisampleBuffer) { return tcu::IVec4(0, 0, multisampleBuffer.raw().getHeight(), multisampleBuffer.raw().getDepth()); } bool isEmpty(const rr::MultisampleConstPixelBufferAccess &access) { return access.raw().getWidth() == 0 || access.raw().getHeight() == 0 || access.raw().getDepth() == 0; } struct DrawContext { int primitiveID; DrawContext(void) : primitiveID(0) { } }; /*--------------------------------------------------------------------*//*! * \brief Calculates intersection of two rects given as (left, bottom, width, height) *//*--------------------------------------------------------------------*/ tcu::IVec4 rectIntersection(const tcu::IVec4 &a, const tcu::IVec4 &b) { const tcu::IVec2 pos = tcu::IVec2(de::max(a.x(), b.x()), de::max(a.y(), b.y())); const tcu::IVec2 endPos = tcu::IVec2(de::min(a.x() + a.z(), b.x() + b.z()), de::min(a.y() + a.w(), b.y() + b.w())); return tcu::IVec4(pos.x(), pos.y(), endPos.x() - pos.x(), endPos.y() - pos.y()); } void convertPrimitiveToBaseType(std::vector &output, std::vector &input) { std::swap(output, input); } void convertPrimitiveToBaseType(std::vector &output, std::vector &input) { std::swap(output, input); } void convertPrimitiveToBaseType(std::vector &output, std::vector &input) { std::swap(output, input); } void convertPrimitiveToBaseType(std::vector &output, std::vector &input) { output.resize(input.size()); for (size_t i = 0; i < input.size(); ++i) { const int adjacentProvokingVertex = input[i].provokingIndex; const int baseProvokingVertexIndex = adjacentProvokingVertex - 1; output[i] = pa::Line(input[i].v1, input[i].v2, baseProvokingVertexIndex); } } void convertPrimitiveToBaseType(std::vector &output, std::vector &input) { output.resize(input.size()); for (size_t i = 0; i < input.size(); ++i) { const int adjacentProvokingVertex = input[i].provokingIndex; const int baseProvokingVertexIndex = adjacentProvokingVertex / 2; output[i] = pa::Triangle(input[i].v0, input[i].v2, input[i].v4, baseProvokingVertexIndex); } } namespace cliputil { /*--------------------------------------------------------------------*//*! * \brief Get clipped portion of the second endpoint * * Calculate the intersection of line segment v0-v1 and a given plane. Line * segment is defined by a pair of one-dimensional homogeneous coordinates. * *//*--------------------------------------------------------------------*/ ClipFloat getSegmentVolumeEdgeClip(const ClipFloat v0, const ClipFloat w0, const ClipFloat v1, const ClipFloat w1, const ClipFloat plane) { // The +epsilon avoids division by zero without causing a meaningful change in the calculation. // Fixes divide by zero in builds when using the gcc toolset. return (plane * w0 - v0) / ((v1 - v0) - plane * (w1 - w0) + std::numeric_limits::epsilon()); } /*--------------------------------------------------------------------*//*! * \brief Get clipped portion of the endpoint * * How much (in [0-1] range) of a line segment v0-v1 would be clipped * of the v0 end of the line segment by clipping. *//*--------------------------------------------------------------------*/ ClipFloat getLineEndpointClipping(const ClipVec4 &v0, const ClipVec4 &v1) { const ClipFloat clipVolumeSize = (ClipFloat)1.0; if (v0.z() > v0.w()) { // Clip +Z return getSegmentVolumeEdgeClip(v0.z(), v0.w(), v1.z(), v1.w(), clipVolumeSize); } else if (v0.z() < -v0.w()) { // Clip -Z return getSegmentVolumeEdgeClip(v0.z(), v0.w(), v1.z(), v1.w(), -clipVolumeSize); } else { // no clipping return (ClipFloat)0.0; } } ClipVec4 vec4ToClipVec4(const tcu::Vec4 &v) { return ClipVec4((ClipFloat)v.x(), (ClipFloat)v.y(), (ClipFloat)v.z(), (ClipFloat)v.w()); } tcu::Vec4 clipVec4ToVec4(const ClipVec4 &v) { return tcu::Vec4((float)v.x(), (float)v.y(), (float)v.z(), (float)v.w()); } class ClipVolumePlane { public: virtual ~ClipVolumePlane() { } virtual bool pointInClipVolume(const ClipVec4 &p) const = 0; virtual ClipFloat clipLineSegmentEnd(const ClipVec4 &v0, const ClipVec4 &v1) const = 0; virtual ClipVec4 getLineIntersectionPoint(const ClipVec4 &v0, const ClipVec4 &v1) const = 0; }; template class ComponentPlane : public ClipVolumePlane { DE_STATIC_ASSERT(Sign == +1 || Sign == -1); public: bool pointInClipVolume(const ClipVec4 &p) const; ClipFloat clipLineSegmentEnd(const ClipVec4 &v0, const ClipVec4 &v1) const; ClipVec4 getLineIntersectionPoint(const ClipVec4 &v0, const ClipVec4 &v1) const; }; template bool ComponentPlane::pointInClipVolume(const ClipVec4 &p) const { const ClipFloat clipVolumeSize = (ClipFloat)1.0; return (ClipFloat)(Sign * p[CompNdx]) <= clipVolumeSize * p.w(); } template ClipFloat ComponentPlane::clipLineSegmentEnd(const ClipVec4 &v0, const ClipVec4 &v1) const { const ClipFloat clipVolumeSize = (ClipFloat)1.0; return getSegmentVolumeEdgeClip(v0[CompNdx], v0.w(), v1[CompNdx], v1.w(), (ClipFloat)Sign * clipVolumeSize); } template ClipVec4 ComponentPlane::getLineIntersectionPoint(const ClipVec4 &v0, const ClipVec4 &v1) const { // A point on line might be far away, causing clipping ratio (clipLineSegmentEnd) to become extremely close to 1.0 // even if the another point is not on the plane. Prevent clipping ratio from saturating by using points on line // that are (nearly) on this and (nearly) on the opposite plane. const ClipVec4 clippedV0 = tcu::mix(v0, v1, ComponentPlane<+1, CompNdx>().clipLineSegmentEnd(v0, v1)); const ClipVec4 clippedV1 = tcu::mix(v0, v1, ComponentPlane<-1, CompNdx>().clipLineSegmentEnd(v0, v1)); const ClipFloat clipRatio = clipLineSegmentEnd(clippedV0, clippedV1); // Find intersection point of line from v0 to v1 and the current plane. Avoid ratios near 1.0 if (clipRatio <= (ClipFloat)0.5) return tcu::mix(clippedV0, clippedV1, clipRatio); else { const ClipFloat complementClipRatio = clipLineSegmentEnd(clippedV1, clippedV0); return tcu::mix(clippedV1, clippedV0, complementClipRatio); } } struct TriangleVertex { ClipVec4 position; ClipFloat weight[3]; //!< barycentrics }; struct SubTriangle { TriangleVertex vertices[3]; }; void clipTriangleOneVertex(std::vector &clippedEdges, const ClipVolumePlane &plane, const TriangleVertex &clipped, const TriangleVertex &v1, const TriangleVertex &v2) { const ClipFloat degenerateLimit = (ClipFloat)1.0; // calc clip pos TriangleVertex mid1; TriangleVertex mid2; bool outputDegenerate = false; { const TriangleVertex &inside = v1; const TriangleVertex &outside = clipped; TriangleVertex &middle = mid1; const ClipFloat hitDist = plane.clipLineSegmentEnd(inside.position, outside.position); if (hitDist >= degenerateLimit) { // do not generate degenerate triangles outputDegenerate = true; } else { const ClipVec4 approximatedClipPoint = tcu::mix(inside.position, outside.position, hitDist); const ClipVec4 anotherPointOnLine = (hitDist > (ClipFloat)0.5) ? (inside.position) : (outside.position); middle.position = plane.getLineIntersectionPoint(approximatedClipPoint, anotherPointOnLine); middle.weight[0] = tcu::mix(inside.weight[0], outside.weight[0], hitDist); middle.weight[1] = tcu::mix(inside.weight[1], outside.weight[1], hitDist); middle.weight[2] = tcu::mix(inside.weight[2], outside.weight[2], hitDist); } } { const TriangleVertex &inside = v2; const TriangleVertex &outside = clipped; TriangleVertex &middle = mid2; const ClipFloat hitDist = plane.clipLineSegmentEnd(inside.position, outside.position); if (hitDist >= degenerateLimit) { // do not generate degenerate triangles outputDegenerate = true; } else { const ClipVec4 approximatedClipPoint = tcu::mix(inside.position, outside.position, hitDist); const ClipVec4 anotherPointOnLine = (hitDist > (ClipFloat)0.5) ? (inside.position) : (outside.position); middle.position = plane.getLineIntersectionPoint(approximatedClipPoint, anotherPointOnLine); middle.weight[0] = tcu::mix(inside.weight[0], outside.weight[0], hitDist); middle.weight[1] = tcu::mix(inside.weight[1], outside.weight[1], hitDist); middle.weight[2] = tcu::mix(inside.weight[2], outside.weight[2], hitDist); } } if (!outputDegenerate) { // gen quad (v1) -> mid1 -> mid2 -> (v2) clippedEdges.push_back(v1); clippedEdges.push_back(mid1); clippedEdges.push_back(mid2); clippedEdges.push_back(v2); } else { // don't modify clippedEdges.push_back(v1); clippedEdges.push_back(clipped); clippedEdges.push_back(v2); } } void clipTriangleTwoVertices(std::vector &clippedEdges, const ClipVolumePlane &plane, const TriangleVertex &v0, const TriangleVertex &clipped1, const TriangleVertex &clipped2) { const ClipFloat unclippableLimit = (ClipFloat)1.0; // calc clip pos TriangleVertex mid1; TriangleVertex mid2; bool unclippableVertex1 = false; bool unclippableVertex2 = false; { const TriangleVertex &inside = v0; const TriangleVertex &outside = clipped1; TriangleVertex &middle = mid1; const ClipFloat hitDist = plane.clipLineSegmentEnd(inside.position, outside.position); if (hitDist >= unclippableLimit) { // this edge cannot be clipped because the edge is really close to the volume boundary unclippableVertex1 = true; } else { const ClipVec4 approximatedClipPoint = tcu::mix(inside.position, outside.position, hitDist); const ClipVec4 anotherPointOnLine = (hitDist > (ClipFloat)0.5) ? (inside.position) : (outside.position); middle.position = plane.getLineIntersectionPoint(approximatedClipPoint, anotherPointOnLine); middle.weight[0] = tcu::mix(inside.weight[0], outside.weight[0], hitDist); middle.weight[1] = tcu::mix(inside.weight[1], outside.weight[1], hitDist); middle.weight[2] = tcu::mix(inside.weight[2], outside.weight[2], hitDist); } } { const TriangleVertex &inside = v0; const TriangleVertex &outside = clipped2; TriangleVertex &middle = mid2; const ClipFloat hitDist = plane.clipLineSegmentEnd(inside.position, outside.position); if (hitDist >= unclippableLimit) { // this edge cannot be clipped because the edge is really close to the volume boundary unclippableVertex2 = true; } else { const ClipVec4 approximatedClipPoint = tcu::mix(inside.position, outside.position, hitDist); const ClipVec4 anotherPointOnLine = (hitDist > (ClipFloat)0.5) ? (inside.position) : (outside.position); middle.position = plane.getLineIntersectionPoint(approximatedClipPoint, anotherPointOnLine); middle.weight[0] = tcu::mix(inside.weight[0], outside.weight[0], hitDist); middle.weight[1] = tcu::mix(inside.weight[1], outside.weight[1], hitDist); middle.weight[2] = tcu::mix(inside.weight[2], outside.weight[2], hitDist); } } if (!unclippableVertex1 && !unclippableVertex2) { // gen triangle (v0) -> mid1 -> mid2 clippedEdges.push_back(v0); clippedEdges.push_back(mid1); clippedEdges.push_back(mid2); } else if (!unclippableVertex1 && unclippableVertex2) { // clip just vertex 1 clippedEdges.push_back(v0); clippedEdges.push_back(mid1); clippedEdges.push_back(clipped2); } else if (unclippableVertex1 && !unclippableVertex2) { // clip just vertex 2 clippedEdges.push_back(v0); clippedEdges.push_back(clipped1); clippedEdges.push_back(mid2); } else { // don't modify clippedEdges.push_back(v0); clippedEdges.push_back(clipped1); clippedEdges.push_back(clipped2); } } void clipTriangleToPlane(std::vector &clippedEdges, const TriangleVertex *vertices, const ClipVolumePlane &plane) { const bool v0Clipped = !plane.pointInClipVolume(vertices[0].position); const bool v1Clipped = !plane.pointInClipVolume(vertices[1].position); const bool v2Clipped = !plane.pointInClipVolume(vertices[2].position); const int clipCount = ((v0Clipped) ? (1) : (0)) + ((v1Clipped) ? (1) : (0)) + ((v2Clipped) ? (1) : (0)); if (clipCount == 0) { // pass clippedEdges.insert(clippedEdges.begin(), vertices, vertices + 3); } else if (clipCount == 1) { // clip one vertex if (v0Clipped) clipTriangleOneVertex(clippedEdges, plane, vertices[0], vertices[1], vertices[2]); else if (v1Clipped) clipTriangleOneVertex(clippedEdges, plane, vertices[1], vertices[2], vertices[0]); else clipTriangleOneVertex(clippedEdges, plane, vertices[2], vertices[0], vertices[1]); } else if (clipCount == 2) { // clip two vertices if (!v0Clipped) clipTriangleTwoVertices(clippedEdges, plane, vertices[0], vertices[1], vertices[2]); else if (!v1Clipped) clipTriangleTwoVertices(clippedEdges, plane, vertices[1], vertices[2], vertices[0]); else clipTriangleTwoVertices(clippedEdges, plane, vertices[2], vertices[0], vertices[1]); } else if (clipCount == 3) { // discard } else { DE_ASSERT(false); } } } // namespace cliputil tcu::Vec2 to2DCartesian(const tcu::Vec4 &p) { return tcu::Vec2(p.x(), p.y()) / p.w(); } float cross2D(const tcu::Vec2 &a, const tcu::Vec2 &b) { return tcu::cross(tcu::Vec3(a.x(), a.y(), 0.0f), tcu::Vec3(b.x(), b.y(), 0.0f)).z(); } void flatshadePrimitiveVertices(pa::Triangle &target, size_t outputNdx) { const rr::GenericVec4 flatValue = target.getProvokingVertex()->outputs[outputNdx]; target.v0->outputs[outputNdx] = flatValue; target.v1->outputs[outputNdx] = flatValue; target.v2->outputs[outputNdx] = flatValue; } void flatshadePrimitiveVertices(pa::Line &target, size_t outputNdx) { const rr::GenericVec4 flatValue = target.getProvokingVertex()->outputs[outputNdx]; target.v0->outputs[outputNdx] = flatValue; target.v1->outputs[outputNdx] = flatValue; } void flatshadePrimitiveVertices(pa::Point &target, size_t outputNdx) { DE_UNREF(target); DE_UNREF(outputNdx); } template void flatshadeVertices(const Program &program, ContainerType &list) { // flatshade const std::vector &fragInputs = (program.geometryShader) ? (program.geometryShader->getOutputs()) : (program.vertexShader->getOutputs()); for (size_t inputNdx = 0; inputNdx < fragInputs.size(); ++inputNdx) if (fragInputs[inputNdx].flatshade) for (typename ContainerType::iterator it = list.begin(); it != list.end(); ++it) flatshadePrimitiveVertices(*it, inputNdx); } /*--------------------------------------------------------------------*//*! * Clip triangles to the clip volume. *//*--------------------------------------------------------------------*/ void clipPrimitives(std::vector &list, const Program &program, bool clipWithZPlanes, VertexPacketAllocator &vpalloc) { using namespace cliputil; cliputil::ComponentPlane<+1, 0> clipPosX; cliputil::ComponentPlane<-1, 0> clipNegX; cliputil::ComponentPlane<+1, 1> clipPosY; cliputil::ComponentPlane<-1, 1> clipNegY; cliputil::ComponentPlane<+1, 2> clipPosZ; cliputil::ComponentPlane<-1, 2> clipNegZ; const std::vector &fragInputs = (program.geometryShader) ? (program.geometryShader->getOutputs()) : (program.vertexShader->getOutputs()); const ClipVolumePlane *planes[] = {&clipPosX, &clipNegX, &clipPosY, &clipNegY, &clipPosZ, &clipNegZ}; const int numPlanes = (clipWithZPlanes) ? (6) : (4); std::vector outputTriangles; for (int inputTriangleNdx = 0; inputTriangleNdx < (int)list.size(); ++inputTriangleNdx) { bool clippedByPlane[6]; // Needs clipping? { bool discardPrimitive = false; bool fullyInClipVolume = true; for (int planeNdx = 0; planeNdx < numPlanes; ++planeNdx) { const ClipVolumePlane *plane = planes[planeNdx]; const bool v0InsidePlane = plane->pointInClipVolume(vec4ToClipVec4(list[inputTriangleNdx].v0->position)); const bool v1InsidePlane = plane->pointInClipVolume(vec4ToClipVec4(list[inputTriangleNdx].v1->position)); const bool v2InsidePlane = plane->pointInClipVolume(vec4ToClipVec4(list[inputTriangleNdx].v2->position)); // Fully outside if (!v0InsidePlane && !v1InsidePlane && !v2InsidePlane) { discardPrimitive = true; break; } // Partially outside else if (!v0InsidePlane || !v1InsidePlane || !v2InsidePlane) { clippedByPlane[planeNdx] = true; fullyInClipVolume = false; } // Fully inside else clippedByPlane[planeNdx] = false; } if (discardPrimitive) continue; if (fullyInClipVolume) { outputTriangles.push_back(list[inputTriangleNdx]); continue; } } // Clip { std::vector subTriangles(1); SubTriangle &initialTri = subTriangles[0]; initialTri.vertices[0].position = vec4ToClipVec4(list[inputTriangleNdx].v0->position); initialTri.vertices[0].weight[0] = (ClipFloat)1.0; initialTri.vertices[0].weight[1] = (ClipFloat)0.0; initialTri.vertices[0].weight[2] = (ClipFloat)0.0; initialTri.vertices[1].position = vec4ToClipVec4(list[inputTriangleNdx].v1->position); initialTri.vertices[1].weight[0] = (ClipFloat)0.0; initialTri.vertices[1].weight[1] = (ClipFloat)1.0; initialTri.vertices[1].weight[2] = (ClipFloat)0.0; initialTri.vertices[2].position = vec4ToClipVec4(list[inputTriangleNdx].v2->position); initialTri.vertices[2].weight[0] = (ClipFloat)0.0; initialTri.vertices[2].weight[1] = (ClipFloat)0.0; initialTri.vertices[2].weight[2] = (ClipFloat)1.0; // Clip all subtriangles to all relevant planes for (int planeNdx = 0; planeNdx < numPlanes; ++planeNdx) { std::vector nextPhaseSubTriangles; if (!clippedByPlane[planeNdx]) continue; for (int subTriangleNdx = 0; subTriangleNdx < (int)subTriangles.size(); ++subTriangleNdx) { std::vector convexPrimitive; // Clip triangle and form a convex n-gon ( n c {3, 4} ) clipTriangleToPlane(convexPrimitive, subTriangles[subTriangleNdx].vertices, *planes[planeNdx]); // Subtriangle completely discarded if (convexPrimitive.empty()) continue; DE_ASSERT(convexPrimitive.size() == 3 || convexPrimitive.size() == 4); //Triangulate planar convex n-gon { TriangleVertex &v0 = convexPrimitive[0]; for (int subsubTriangleNdx = 1; subsubTriangleNdx + 1 < (int)convexPrimitive.size(); ++subsubTriangleNdx) { const float degenerateEpsilon = 1.0e-6f; const TriangleVertex &v1 = convexPrimitive[subsubTriangleNdx]; const TriangleVertex &v2 = convexPrimitive[subsubTriangleNdx + 1]; const float visibleArea = de::abs(cross2D(to2DCartesian(clipVec4ToVec4(v1.position)) - to2DCartesian(clipVec4ToVec4(v0.position)), to2DCartesian(clipVec4ToVec4(v2.position)) - to2DCartesian(clipVec4ToVec4(v0.position)))); // has surface area (is not a degenerate) if (visibleArea >= degenerateEpsilon) { SubTriangle subsubTriangle; subsubTriangle.vertices[0] = v0; subsubTriangle.vertices[1] = v1; subsubTriangle.vertices[2] = v2; nextPhaseSubTriangles.push_back(subsubTriangle); } } } } subTriangles.swap(nextPhaseSubTriangles); } // Rebuild pa::Triangles from subtriangles for (int subTriangleNdx = 0; subTriangleNdx < (int)subTriangles.size(); ++subTriangleNdx) { VertexPacket *p0 = vpalloc.alloc(); VertexPacket *p1 = vpalloc.alloc(); VertexPacket *p2 = vpalloc.alloc(); pa::Triangle ngonFragment(p0, p1, p2, -1); p0->position = clipVec4ToVec4(subTriangles[subTriangleNdx].vertices[0].position); p1->position = clipVec4ToVec4(subTriangles[subTriangleNdx].vertices[1].position); p2->position = clipVec4ToVec4(subTriangles[subTriangleNdx].vertices[2].position); for (size_t outputNdx = 0; outputNdx < fragInputs.size(); ++outputNdx) { if (fragInputs[outputNdx].type == GENERICVECTYPE_FLOAT) { const tcu::Vec4 out0 = list[inputTriangleNdx].v0->outputs[outputNdx].get(); const tcu::Vec4 out1 = list[inputTriangleNdx].v1->outputs[outputNdx].get(); const tcu::Vec4 out2 = list[inputTriangleNdx].v2->outputs[outputNdx].get(); p0->outputs[outputNdx] = (float)subTriangles[subTriangleNdx].vertices[0].weight[0] * out0 + (float)subTriangles[subTriangleNdx].vertices[0].weight[1] * out1 + (float)subTriangles[subTriangleNdx].vertices[0].weight[2] * out2; p1->outputs[outputNdx] = (float)subTriangles[subTriangleNdx].vertices[1].weight[0] * out0 + (float)subTriangles[subTriangleNdx].vertices[1].weight[1] * out1 + (float)subTriangles[subTriangleNdx].vertices[1].weight[2] * out2; p2->outputs[outputNdx] = (float)subTriangles[subTriangleNdx].vertices[2].weight[0] * out0 + (float)subTriangles[subTriangleNdx].vertices[2].weight[1] * out1 + (float)subTriangles[subTriangleNdx].vertices[2].weight[2] * out2; } else { // only floats are interpolated, all others must be flatshaded then p0->outputs[outputNdx] = list[inputTriangleNdx].getProvokingVertex()->outputs[outputNdx]; p1->outputs[outputNdx] = list[inputTriangleNdx].getProvokingVertex()->outputs[outputNdx]; p2->outputs[outputNdx] = list[inputTriangleNdx].getProvokingVertex()->outputs[outputNdx]; } } outputTriangles.push_back(ngonFragment); } } } // output result list.swap(outputTriangles); } /*--------------------------------------------------------------------*//*! * Clip lines to the near and far clip planes. * * Clipping to other planes is a by-product of the viewport test (i.e. * rasterization area selection). *//*--------------------------------------------------------------------*/ void clipPrimitives(std::vector &list, const Program &program, bool clipWithZPlanes, VertexPacketAllocator &vpalloc) { DE_UNREF(vpalloc); using namespace cliputil; // Lines are clipped only by the far and the near planes here. Line clipping by other planes done in the rasterization phase const std::vector &fragInputs = (program.geometryShader) ? (program.geometryShader->getOutputs()) : (program.vertexShader->getOutputs()); std::vector visibleLines; // Z-clipping disabled, don't do anything if (!clipWithZPlanes) return; for (size_t ndx = 0; ndx < list.size(); ++ndx) { pa::Line &l = list[ndx]; // Totally discarded? if ((l.v0->position.z() < -l.v0->position.w() && l.v1->position.z() < -l.v1->position.w()) || (l.v0->position.z() > l.v0->position.w() && l.v1->position.z() > l.v1->position.w())) continue; // discard // Something is visible const ClipVec4 p0 = vec4ToClipVec4(l.v0->position); const ClipVec4 p1 = vec4ToClipVec4(l.v1->position); const ClipFloat t0 = getLineEndpointClipping(p0, p1); const ClipFloat t1 = getLineEndpointClipping(p1, p0); // Not clipped at all? if (t0 == (ClipFloat)0.0 && t1 == (ClipFloat)0.0) { visibleLines.push_back(pa::Line(l.v0, l.v1, -1)); } else { // Clip position l.v0->position = clipVec4ToVec4(tcu::mix(p0, p1, t0)); l.v1->position = clipVec4ToVec4(tcu::mix(p1, p0, t1)); // Clip attributes for (size_t outputNdx = 0; outputNdx < fragInputs.size(); ++outputNdx) { // only floats are clipped, other types are flatshaded if (fragInputs[outputNdx].type == GENERICVECTYPE_FLOAT) { const tcu::Vec4 a0 = l.v0->outputs[outputNdx].get(); const tcu::Vec4 a1 = l.v1->outputs[outputNdx].get(); l.v0->outputs[outputNdx] = tcu::mix(a0, a1, (float)t0); l.v1->outputs[outputNdx] = tcu::mix(a1, a0, (float)t1); } } visibleLines.push_back(pa::Line(l.v0, l.v1, -1)); } } // return visible in list std::swap(visibleLines, list); } /*--------------------------------------------------------------------*//*! * Discard points not within clip volume. Clipping is a by-product * of the viewport test. *//*--------------------------------------------------------------------*/ void clipPrimitives(std::vector &list, const Program &program, bool clipWithZPlanes, VertexPacketAllocator &vpalloc) { DE_UNREF(vpalloc); DE_UNREF(program); std::vector visiblePoints; // Z-clipping disabled, don't do anything if (!clipWithZPlanes) return; for (size_t ndx = 0; ndx < list.size(); ++ndx) { pa::Point &p = list[ndx]; // points are discarded if Z is not in range. (Wide) point clipping is done in the rasterization phase if (de::inRange(p.v0->position.z(), -p.v0->position.w(), p.v0->position.w())) visiblePoints.push_back(pa::Point(p.v0)); } // return visible in list std::swap(visiblePoints, list); } void transformVertexClipCoordsToWindowCoords(const RenderState &state, VertexPacket &packet) { // To normalized device coords { packet.position = tcu::Vec4(packet.position.x() / packet.position.w(), packet.position.y() / packet.position.w(), packet.position.z() / packet.position.w(), 1.0f / packet.position.w()); } // To window coords { const WindowRectangle &viewport = state.viewport.rect; const float halfW = (float)(viewport.width) / 2.0f; const float halfH = (float)(viewport.height) / 2.0f; const float oX = (float)viewport.left + halfW; const float oY = (float)viewport.bottom + halfH; const float zn = state.viewport.zn; const float zf = state.viewport.zf; packet.position = tcu::Vec4(packet.position.x() * halfW + oX, packet.position.y() * halfH + oY, packet.position.z() * (zf - zn) / 2.0f + (zn + zf) / 2.0f, packet.position.w()); } } void transformPrimitiveClipCoordsToWindowCoords(const RenderState &state, pa::Triangle &target) { transformVertexClipCoordsToWindowCoords(state, *target.v0); transformVertexClipCoordsToWindowCoords(state, *target.v1); transformVertexClipCoordsToWindowCoords(state, *target.v2); } void transformPrimitiveClipCoordsToWindowCoords(const RenderState &state, pa::Line &target) { transformVertexClipCoordsToWindowCoords(state, *target.v0); transformVertexClipCoordsToWindowCoords(state, *target.v1); } void transformPrimitiveClipCoordsToWindowCoords(const RenderState &state, pa::Point &target) { transformVertexClipCoordsToWindowCoords(state, *target.v0); } template void transformClipCoordsToWindowCoords(const RenderState &state, ContainerType &list) { for (typename ContainerType::iterator it = list.begin(); it != list.end(); ++it) transformPrimitiveClipCoordsToWindowCoords(state, *it); } void makeSharedVerticeDistinct(VertexPacket *&packet, std::set> &vertices, VertexPacketAllocator &vpalloc) { // distinct if (vertices.find(packet) == vertices.end()) { vertices.insert(packet); } else { VertexPacket *newPacket = vpalloc.alloc(); // copy packet output values newPacket->position = packet->position; newPacket->pointSize = packet->pointSize; newPacket->primitiveID = packet->primitiveID; for (size_t outputNdx = 0; outputNdx < vpalloc.getNumVertexOutputs(); ++outputNdx) newPacket->outputs[outputNdx] = packet->outputs[outputNdx]; // no need to insert new packet to "vertices" as newPacket is unique packet = newPacket; } } void makeSharedVerticesDistinct(pa::Triangle &target, std::set> &vertices, VertexPacketAllocator &vpalloc) { makeSharedVerticeDistinct(target.v0, vertices, vpalloc); makeSharedVerticeDistinct(target.v1, vertices, vpalloc); makeSharedVerticeDistinct(target.v2, vertices, vpalloc); } void makeSharedVerticesDistinct(pa::Line &target, std::set> &vertices, VertexPacketAllocator &vpalloc) { makeSharedVerticeDistinct(target.v0, vertices, vpalloc); makeSharedVerticeDistinct(target.v1, vertices, vpalloc); } void makeSharedVerticesDistinct(pa::Point &target, std::set> &vertices, VertexPacketAllocator &vpalloc) { makeSharedVerticeDistinct(target.v0, vertices, vpalloc); } template void makeSharedVerticesDistinct(ContainerType &list, VertexPacketAllocator &vpalloc) { std::set> vertices; for (typename ContainerType::iterator it = list.begin(); it != list.end(); ++it) makeSharedVerticesDistinct(*it, vertices, vpalloc); } void generatePrimitiveIDs(pa::Triangle &target, int id) { target.v0->primitiveID = id; target.v1->primitiveID = id; target.v2->primitiveID = id; } void generatePrimitiveIDs(pa::Line &target, int id) { target.v0->primitiveID = id; target.v1->primitiveID = id; } void generatePrimitiveIDs(pa::Point &target, int id) { target.v0->primitiveID = id; } template void generatePrimitiveIDs(ContainerType &list, DrawContext &drawContext) { for (typename ContainerType::iterator it = list.begin(); it != list.end(); ++it) generatePrimitiveIDs(*it, drawContext.primitiveID++); } static float findTriangleVertexDepthSlope(const tcu::Vec4 &p, const tcu::Vec4 &v0, const tcu::Vec4 &v1) { // screen space const tcu::Vec3 ssp = p.swizzle(0, 1, 2); const tcu::Vec3 ssv0 = v0.swizzle(0, 1, 2); const tcu::Vec3 ssv1 = v1.swizzle(0, 1, 2); // dx & dy const tcu::Vec3 a = ssv0.swizzle(0, 1, 2) - ssp.swizzle(0, 1, 2); const tcu::Vec3 b = ssv1.swizzle(0, 1, 2) - ssp.swizzle(0, 1, 2); const float epsilon = 0.0001f; const float det = (a.x() * b.y() - b.x() * a.y()); // degenerate triangle, it won't generate any fragments anyway. Return value doesn't matter if (de::abs(det) < epsilon) return 0.0f; const tcu::Vec2 dxDir = tcu::Vec2(b.y(), -a.y()) / det; const tcu::Vec2 dyDir = tcu::Vec2(-b.x(), a.x()) / det; const float dzdx = dxDir.x() * a.z() + dxDir.y() * b.z(); const float dzdy = dyDir.x() * a.z() + dyDir.y() * b.z(); // approximate using max(|dz/dx|, |dz/dy|) return de::max(de::abs(dzdx), de::abs(dzdy)); } static float findPrimitiveMaximumDepthSlope(const pa::Triangle &triangle) { const float d1 = findTriangleVertexDepthSlope(triangle.v0->position, triangle.v1->position, triangle.v2->position); const float d2 = findTriangleVertexDepthSlope(triangle.v1->position, triangle.v2->position, triangle.v0->position); const float d3 = findTriangleVertexDepthSlope(triangle.v2->position, triangle.v0->position, triangle.v1->position); return de::max(d1, de::max(d2, d3)); } static float getFloatingPointMinimumResolvableDifference(float maxZValue, tcu::TextureFormat::ChannelType type) { if (type == tcu::TextureFormat::FLOAT) { // 32f const int maxExponent = tcu::Float32(maxZValue).exponent(); return tcu::Float32::construct(+1, maxExponent - 23, 1 << 23).asFloat(); } // unexpected format DE_ASSERT(false); return 0.0f; } static float getFixedPointMinimumResolvableDifference(int numBits) { return tcu::Float32::construct(+1, -numBits, 1 << 23).asFloat(); } static float findPrimitiveMinimumResolvableDifference(const pa::Triangle &triangle, const rr::MultisampleConstPixelBufferAccess &depthAccess) { const float maxZvalue = de::max(de::max(triangle.v0->position.z(), triangle.v1->position.z()), triangle.v2->position.z()); const tcu::TextureFormat format = depthAccess.raw().getFormat(); const tcu::TextureFormat::ChannelOrder order = format.order; if (order == tcu::TextureFormat::D) { // depth only const tcu::TextureFormat::ChannelType channelType = format.type; const tcu::TextureChannelClass channelClass = tcu::getTextureChannelClass(channelType); const int numBits = tcu::getTextureFormatBitDepth(format).x(); if (channelClass == tcu::TEXTURECHANNELCLASS_FLOATING_POINT) return getFloatingPointMinimumResolvableDifference(maxZvalue, channelType); else // \note channelClass might be CLASS_LAST but that's ok return getFixedPointMinimumResolvableDifference(numBits); } else if (order == tcu::TextureFormat::DS) { // depth stencil, special cases for possible combined formats if (format.type == tcu::TextureFormat::FLOAT_UNSIGNED_INT_24_8_REV) return getFloatingPointMinimumResolvableDifference(maxZvalue, tcu::TextureFormat::FLOAT); else if (format.type == tcu::TextureFormat::UNSIGNED_INT_24_8) return getFixedPointMinimumResolvableDifference(24); } // unexpected format DE_ASSERT(false); return 0.0f; } void writeFragmentPackets(const RenderState &state, const RenderTarget &renderTarget, const Program &program, const FragmentPacket *fragmentPackets, int numRasterizedPackets, rr::FaceType facetype, const std::vector &fragmentOutputArray, const std::vector &fragmentOutputArraySrc1, const float *depthValues, std::vector &fragmentBuffer) { const int numSamples = renderTarget.getNumSamples(); const size_t numOutputs = program.fragmentShader->getOutputs().size(); FragmentProcessor fragProcessor; DE_ASSERT(fragmentOutputArray.size() >= (size_t)numRasterizedPackets * 4 * numOutputs); DE_ASSERT(fragmentBuffer.size() >= (size_t)numRasterizedPackets * 4); // Translate fragments but do not set the value yet { int fragCount = 0; for (int packetNdx = 0; packetNdx < numRasterizedPackets; ++packetNdx) for (int fragNdx = 0; fragNdx < 4; fragNdx++) { const FragmentPacket &packet = fragmentPackets[packetNdx]; const int xo = fragNdx % 2; const int yo = fragNdx / 2; if (getCoverageAnyFragmentSampleLive(packet.coverage, numSamples, xo, yo)) { Fragment &fragment = fragmentBuffer[fragCount++]; fragment.pixelCoord = packet.position + tcu::IVec2(xo, yo); fragment.coverage = (uint32_t)((packet.coverage & getCoverageFragmentSampleBits(numSamples, xo, yo)) >> getCoverageOffset(numSamples, xo, yo)); fragment.sampleDepths = (depthValues) ? (&depthValues[(packetNdx * 4 + yo * 2 + xo) * numSamples]) : (DE_NULL); } } } // Set per output output values { rr::FragmentOperationState noStencilDepthWriteState(state.fragOps); noStencilDepthWriteState.depthMask = false; noStencilDepthWriteState.stencilStates[facetype].sFail = STENCILOP_KEEP; noStencilDepthWriteState.stencilStates[facetype].dpFail = STENCILOP_KEEP; noStencilDepthWriteState.stencilStates[facetype].dpPass = STENCILOP_KEEP; int fragCount = 0; for (size_t outputNdx = 0; outputNdx < numOutputs; ++outputNdx) { // Only the last output-pass has default state, other passes have stencil & depth writemask=0 const rr::FragmentOperationState &fragOpsState = (outputNdx == numOutputs - 1) ? (state.fragOps) : (noStencilDepthWriteState); for (int packetNdx = 0; packetNdx < numRasterizedPackets; ++packetNdx) for (int fragNdx = 0; fragNdx < 4; fragNdx++) { const FragmentPacket &packet = fragmentPackets[packetNdx]; const int xo = fragNdx % 2; const int yo = fragNdx / 2; // Add only fragments that have live samples to shaded fragments queue. if (getCoverageAnyFragmentSampleLive(packet.coverage, numSamples, xo, yo)) { Fragment &fragment = fragmentBuffer[fragCount++]; fragment.value = fragmentOutputArray[(packetNdx * 4 + fragNdx) * numOutputs + outputNdx]; fragment.value1 = fragmentOutputArraySrc1[(packetNdx * 4 + fragNdx) * numOutputs + outputNdx]; } } // Execute per-fragment ops and write fragProcessor.render(renderTarget.getColorBuffer((int)outputNdx), renderTarget.getDepthBuffer(), renderTarget.getStencilBuffer(), &fragmentBuffer[0], fragCount, facetype, fragOpsState); } } } void rasterizePrimitive(const RenderState &state, const RenderTarget &renderTarget, const Program &program, const pa::Triangle &triangle, const tcu::IVec4 &renderTargetRect, RasterizationInternalBuffers &buffers) { const int numSamples = renderTarget.getNumSamples(); const float depthClampMin = de::min(state.viewport.zn, state.viewport.zf); const float depthClampMax = de::max(state.viewport.zn, state.viewport.zf); TriangleRasterizer rasterizer(renderTargetRect, numSamples, state.rasterization, state.subpixelBits); float depthOffset = 0.0f; rasterizer.init(triangle.v0->position, triangle.v1->position, triangle.v2->position); // Culling const FaceType visibleFace = rasterizer.getVisibleFace(); if ((state.cullMode == CULLMODE_FRONT && visibleFace == FACETYPE_FRONT) || (state.cullMode == CULLMODE_BACK && visibleFace == FACETYPE_BACK)) return; // Shading context FragmentShadingContext shadingContext( triangle.v0->outputs, triangle.v1->outputs, triangle.v2->outputs, &buffers.shaderOutputs[0], &buffers.shaderOutputsSrc1[0], buffers.fragmentDepthBuffer, triangle.v2->primitiveID, (int)program.fragmentShader->getOutputs().size(), numSamples, rasterizer.getVisibleFace()); // Polygon offset if (buffers.fragmentDepthBuffer && state.fragOps.polygonOffsetEnabled) { const float maximumDepthSlope = findPrimitiveMaximumDepthSlope(triangle); const float minimumResolvableDifference = findPrimitiveMinimumResolvableDifference(triangle, renderTarget.getDepthBuffer()); depthOffset = maximumDepthSlope * state.fragOps.polygonOffsetFactor + minimumResolvableDifference * state.fragOps.polygonOffsetUnits; } // Execute rasterize - shade - write loop for (;;) { const int maxFragmentPackets = (int)buffers.fragmentPackets.size(); int numRasterizedPackets = 0; // Rasterize rasterizer.rasterize(&buffers.fragmentPackets[0], buffers.fragmentDepthBuffer, maxFragmentPackets, numRasterizedPackets); // numRasterizedPackets is guaranteed to be greater than zero for shadeFragments() if (!numRasterizedPackets) break; // Rasterization finished. // Polygon offset if (buffers.fragmentDepthBuffer && state.fragOps.polygonOffsetEnabled) for (int sampleNdx = 0; sampleNdx < numRasterizedPackets * 4 * numSamples; ++sampleNdx) buffers.fragmentDepthBuffer[sampleNdx] = de::clamp(buffers.fragmentDepthBuffer[sampleNdx] + depthOffset, 0.0f, 1.0f); // Shade program.fragmentShader->shadeFragments(&buffers.fragmentPackets[0], numRasterizedPackets, shadingContext); // Depth clamp if (buffers.fragmentDepthBuffer && state.fragOps.depthClampEnabled) for (int sampleNdx = 0; sampleNdx < numRasterizedPackets * 4 * numSamples; ++sampleNdx) buffers.fragmentDepthBuffer[sampleNdx] = de::clamp(buffers.fragmentDepthBuffer[sampleNdx], depthClampMin, depthClampMax); // Handle fragment shader outputs writeFragmentPackets(state, renderTarget, program, &buffers.fragmentPackets[0], numRasterizedPackets, visibleFace, buffers.shaderOutputs, buffers.shaderOutputsSrc1, buffers.fragmentDepthBuffer, buffers.shadedFragments); } } void rasterizePrimitive(const RenderState &state, const RenderTarget &renderTarget, const Program &program, const pa::Line &line, const tcu::IVec4 &renderTargetRect, RasterizationInternalBuffers &buffers) { const int numSamples = renderTarget.getNumSamples(); const float depthClampMin = de::min(state.viewport.zn, state.viewport.zf); const float depthClampMax = de::max(state.viewport.zn, state.viewport.zf); const bool msaa = numSamples > 1; FragmentShadingContext shadingContext(line.v0->outputs, line.v1->outputs, DE_NULL, &buffers.shaderOutputs[0], &buffers.shaderOutputsSrc1[0], buffers.fragmentDepthBuffer, line.v1->primitiveID, (int)program.fragmentShader->getOutputs().size(), numSamples, FACETYPE_FRONT); SingleSampleLineRasterizer aliasedRasterizer(renderTargetRect, state.subpixelBits); MultiSampleLineRasterizer msaaRasterizer(numSamples, renderTargetRect, state.subpixelBits); // Initialize rasterization. if (msaa) msaaRasterizer.init(line.v0->position, line.v1->position, state.line.lineWidth); else aliasedRasterizer.init(line.v0->position, line.v1->position, state.line.lineWidth, 1, 0xFFFF); for (;;) { const int maxFragmentPackets = (int)buffers.fragmentPackets.size(); int numRasterizedPackets = 0; // Rasterize if (msaa) msaaRasterizer.rasterize(&buffers.fragmentPackets[0], buffers.fragmentDepthBuffer, maxFragmentPackets, numRasterizedPackets); else aliasedRasterizer.rasterize(&buffers.fragmentPackets[0], buffers.fragmentDepthBuffer, maxFragmentPackets, numRasterizedPackets); // numRasterizedPackets is guaranteed to be greater than zero for shadeFragments() if (!numRasterizedPackets) break; // Rasterization finished. // Shade program.fragmentShader->shadeFragments(&buffers.fragmentPackets[0], numRasterizedPackets, shadingContext); // Depth clamp if (buffers.fragmentDepthBuffer && state.fragOps.depthClampEnabled) for (int sampleNdx = 0; sampleNdx < numRasterizedPackets * 4 * numSamples; ++sampleNdx) buffers.fragmentDepthBuffer[sampleNdx] = de::clamp(buffers.fragmentDepthBuffer[sampleNdx], depthClampMin, depthClampMax); // Handle fragment shader outputs writeFragmentPackets(state, renderTarget, program, &buffers.fragmentPackets[0], numRasterizedPackets, rr::FACETYPE_FRONT, buffers.shaderOutputs, buffers.shaderOutputsSrc1, buffers.fragmentDepthBuffer, buffers.shadedFragments); } } void rasterizePrimitive(const RenderState &state, const RenderTarget &renderTarget, const Program &program, const pa::Point &point, const tcu::IVec4 &renderTargetRect, RasterizationInternalBuffers &buffers) { const int numSamples = renderTarget.getNumSamples(); const float depthClampMin = de::min(state.viewport.zn, state.viewport.zf); const float depthClampMax = de::max(state.viewport.zn, state.viewport.zf); TriangleRasterizer rasterizer1(renderTargetRect, numSamples, state.rasterization, state.subpixelBits); TriangleRasterizer rasterizer2(renderTargetRect, numSamples, state.rasterization, state.subpixelBits); // draw point as two triangles const float offset = point.v0->pointSize / 2.0f; const tcu::Vec4 w0 = tcu::Vec4(point.v0->position.x() + offset, point.v0->position.y() + offset, point.v0->position.z(), point.v0->position.w()); const tcu::Vec4 w1 = tcu::Vec4(point.v0->position.x() - offset, point.v0->position.y() + offset, point.v0->position.z(), point.v0->position.w()); const tcu::Vec4 w2 = tcu::Vec4(point.v0->position.x() - offset, point.v0->position.y() - offset, point.v0->position.z(), point.v0->position.w()); const tcu::Vec4 w3 = tcu::Vec4(point.v0->position.x() + offset, point.v0->position.y() - offset, point.v0->position.z(), point.v0->position.w()); rasterizer1.init(w0, w1, w2); rasterizer2.init(w0, w2, w3); // Shading context FragmentShadingContext shadingContext(point.v0->outputs, DE_NULL, DE_NULL, &buffers.shaderOutputs[0], &buffers.shaderOutputsSrc1[0], buffers.fragmentDepthBuffer, point.v0->primitiveID, (int)program.fragmentShader->getOutputs().size(), numSamples, FACETYPE_FRONT); // Execute rasterize - shade - write loop for (;;) { const int maxFragmentPackets = (int)buffers.fragmentPackets.size(); int numRasterizedPackets = 0; // Rasterize both triangles rasterizer1.rasterize(&buffers.fragmentPackets[0], buffers.fragmentDepthBuffer, maxFragmentPackets, numRasterizedPackets); if (numRasterizedPackets != maxFragmentPackets) { float *const depthBufferAppendPointer = (buffers.fragmentDepthBuffer) ? (buffers.fragmentDepthBuffer + numRasterizedPackets * numSamples * 4) : (DE_NULL); int numRasterizedPackets2 = 0; rasterizer2.rasterize(&buffers.fragmentPackets[numRasterizedPackets], depthBufferAppendPointer, maxFragmentPackets - numRasterizedPackets, numRasterizedPackets2); numRasterizedPackets += numRasterizedPackets2; } // numRasterizedPackets is guaranteed to be greater than zero for shadeFragments() if (!numRasterizedPackets) break; // Rasterization finished. // Shade program.fragmentShader->shadeFragments(&buffers.fragmentPackets[0], numRasterizedPackets, shadingContext); // Depth clamp if (buffers.fragmentDepthBuffer && state.fragOps.depthClampEnabled) for (int sampleNdx = 0; sampleNdx < numRasterizedPackets * 4 * numSamples; ++sampleNdx) buffers.fragmentDepthBuffer[sampleNdx] = de::clamp(buffers.fragmentDepthBuffer[sampleNdx], depthClampMin, depthClampMax); // Handle fragment shader outputs writeFragmentPackets(state, renderTarget, program, &buffers.fragmentPackets[0], numRasterizedPackets, rr::FACETYPE_FRONT, buffers.shaderOutputs, buffers.shaderOutputsSrc1, buffers.fragmentDepthBuffer, buffers.shadedFragments); } } template void rasterize(const RenderState &state, const RenderTarget &renderTarget, const Program &program, const ContainerType &list) { const int numSamples = renderTarget.getNumSamples(); const int numFragmentOutputs = (int)program.fragmentShader->getOutputs().size(); const size_t maxFragmentPackets = 128; const tcu::IVec4 viewportRect = tcu::IVec4(state.viewport.rect.left, state.viewport.rect.bottom, state.viewport.rect.width, state.viewport.rect.height); const tcu::IVec4 bufferRect = getBufferSize(renderTarget.getColorBuffer(0)); const tcu::IVec4 renderTargetRect = rectIntersection(viewportRect, bufferRect); // shared buffers for all primitives std::vector fragmentPackets(maxFragmentPackets); std::vector shaderOutputs(maxFragmentPackets * 4 * numFragmentOutputs); std::vector shaderOutputsSrc1(maxFragmentPackets * 4 * numFragmentOutputs); std::vector shadedFragments(maxFragmentPackets * 4); std::vector depthValues(0); float *depthBufferPointer = DE_NULL; RasterizationInternalBuffers buffers; // calculate depth only if we have a depth buffer if (!isEmpty(renderTarget.getDepthBuffer())) { depthValues.resize(maxFragmentPackets * 4 * numSamples); depthBufferPointer = &depthValues[0]; } // set buffers buffers.fragmentPackets.swap(fragmentPackets); buffers.shaderOutputs.swap(shaderOutputs); buffers.shaderOutputsSrc1.swap(shaderOutputsSrc1); buffers.shadedFragments.swap(shadedFragments); buffers.fragmentDepthBuffer = depthBufferPointer; // rasterize for (typename ContainerType::const_iterator it = list.begin(); it != list.end(); ++it) rasterizePrimitive(state, renderTarget, program, *it, renderTargetRect, buffers); } /*--------------------------------------------------------------------*//*! * Draws transformed triangles, lines or points to render target *//*--------------------------------------------------------------------*/ template void drawBasicPrimitives(const RenderState &state, const RenderTarget &renderTarget, const Program &program, ContainerType &primList, VertexPacketAllocator &vpalloc) { const bool clipZ = !state.fragOps.depthClampEnabled; // Transform feedback // Flatshading flatshadeVertices(program, primList); // Clipping // \todo [jarkko] is creating & swapping std::vectors really a good solution? clipPrimitives(primList, program, clipZ, vpalloc); // Transform vertices to window coords transformClipCoordsToWindowCoords(state, primList); // Rasterize and paint rasterize(state, renderTarget, program, primList); } void copyVertexPacketPointers(const VertexPacket **dst, const pa::Point &in) { dst[0] = in.v0; } void copyVertexPacketPointers(const VertexPacket **dst, const pa::Line &in) { dst[0] = in.v0; dst[1] = in.v1; } void copyVertexPacketPointers(const VertexPacket **dst, const pa::Triangle &in) { dst[0] = in.v0; dst[1] = in.v1; dst[2] = in.v2; } void copyVertexPacketPointers(const VertexPacket **dst, const pa::LineAdjacency &in) { dst[0] = in.v0; dst[1] = in.v1; dst[2] = in.v2; dst[3] = in.v3; } void copyVertexPacketPointers(const VertexPacket **dst, const pa::TriangleAdjacency &in) { dst[0] = in.v0; dst[1] = in.v1; dst[2] = in.v2; dst[3] = in.v3; dst[4] = in.v4; dst[5] = in.v5; } template // \note DrawPrimitiveType can only be Points, line_strip, or triangle_strip void drawGeometryShaderOutputAsPrimitives(const RenderState &state, const RenderTarget &renderTarget, const Program &program, VertexPacket *const *vertices, size_t numVertices, VertexPacketAllocator &vpalloc) { // Run primitive assembly for generated stream const size_t assemblerPrimitiveCount = PrimitiveTypeTraits::Assembler::getPrimitiveCount(numVertices); std::vector::BaseType> inputPrimitives(assemblerPrimitiveCount); PrimitiveTypeTraits::Assembler::exec( inputPrimitives.begin(), vertices, numVertices, state .provokingVertexConvention); // \note input Primitives are baseType_t => only basic primitives (non adjacency) will compile // Make shared vertices distinct makeSharedVerticesDistinct(inputPrimitives, vpalloc); // Draw assembled primitives drawBasicPrimitives(state, renderTarget, program, inputPrimitives, vpalloc); } template void drawWithGeometryShader(const RenderState &state, const RenderTarget &renderTarget, const Program &program, std::vector::Type> &input, DrawContext &drawContext) { // Vertices outputted by geometry shader may have different number of output variables than the original, create new memory allocator VertexPacketAllocator vpalloc(program.geometryShader->getOutputs().size()); // Run geometry shader for all primitives GeometryEmitter emitter(vpalloc, program.geometryShader->getNumVerticesOut()); std::vector primitives(input.size()); const int numInvocations = (int)program.geometryShader->getNumInvocations(); const int verticesIn = PrimitiveTypeTraits::Type::NUM_VERTICES; for (size_t primitiveNdx = 0; primitiveNdx < input.size(); ++primitiveNdx) { primitives[primitiveNdx].primitiveIDIn = drawContext.primitiveID++; copyVertexPacketPointers(primitives[primitiveNdx].vertices, input[primitiveNdx]); } if (primitives.empty()) return; for (int invocationNdx = 0; invocationNdx < numInvocations; ++invocationNdx) { // Shading invocation program.geometryShader->shadePrimitives(emitter, verticesIn, &primitives[0], (int)primitives.size(), invocationNdx); // Find primitives in the emitted vertices std::vector emitted; emitter.moveEmittedTo(emitted); for (size_t primitiveBegin = 0; primitiveBegin < emitted.size();) { size_t primitiveEnd; // Find primitive begin if (!emitted[primitiveBegin]) { ++primitiveBegin; continue; } // Find primitive end primitiveEnd = primitiveBegin + 1; for (; (primitiveEnd < emitted.size()) && emitted[primitiveEnd]; ++primitiveEnd) ; // find primitive end // Draw range [begin, end) switch (program.geometryShader->getOutputType()) { case rr::GEOMETRYSHADEROUTPUTTYPE_POINTS: drawGeometryShaderOutputAsPrimitives( state, renderTarget, program, &emitted[primitiveBegin], primitiveEnd - primitiveBegin, vpalloc); break; case rr::GEOMETRYSHADEROUTPUTTYPE_LINE_STRIP: drawGeometryShaderOutputAsPrimitives( state, renderTarget, program, &emitted[primitiveBegin], primitiveEnd - primitiveBegin, vpalloc); break; case rr::GEOMETRYSHADEROUTPUTTYPE_TRIANGLE_STRIP: drawGeometryShaderOutputAsPrimitives( state, renderTarget, program, &emitted[primitiveBegin], primitiveEnd - primitiveBegin, vpalloc); break; default: DE_ASSERT(false); } // Next primitive primitiveBegin = primitiveEnd + 1; } } } /*--------------------------------------------------------------------*//*! * Assembles, tesselates, runs geometry shader and draws primitives of any type from vertex list. *//*--------------------------------------------------------------------*/ template void drawAsPrimitives(const RenderState &state, const RenderTarget &renderTarget, const Program &program, VertexPacket *const *vertices, int numVertices, DrawContext &drawContext, VertexPacketAllocator &vpalloc) { // Assemble primitives (deconstruct stips & loops) const size_t assemblerPrimitiveCount = PrimitiveTypeTraits::Assembler::getPrimitiveCount(numVertices); std::vector::Type> inputPrimitives(assemblerPrimitiveCount); PrimitiveTypeTraits::Assembler::exec(inputPrimitives.begin(), vertices, (size_t)numVertices, state.provokingVertexConvention); // Tesselate //if (state.tesselation) // primList = state.tesselation.exec(primList); // Geometry shader if (program.geometryShader) { // If there is an active geometry shader, it will convert any primitive type to basic types drawWithGeometryShader(state, renderTarget, program, inputPrimitives, drawContext); } else { std::vector::BaseType> basePrimitives; // convert types from X_adjacency to X convertPrimitiveToBaseType(basePrimitives, inputPrimitives); // Make shared vertices distinct. Needed for that the translation to screen space happens only once per vertex, and for flatshading makeSharedVerticesDistinct(basePrimitives, vpalloc); // A primitive ID will be generated even if no geometry shader is active generatePrimitiveIDs(basePrimitives, drawContext); // Draw as a basic type drawBasicPrimitives(state, renderTarget, program, basePrimitives, vpalloc); } } bool isValidCommand(const DrawCommand &command, int numInstances) { // numInstances should be valid if (numInstances < 0) return false; // Shaders should have the same varyings if (command.program.geometryShader) { if (command.program.vertexShader->getOutputs() != command.program.geometryShader->getInputs()) return false; if (command.program.geometryShader->getOutputs() != command.program.fragmentShader->getInputs()) return false; } else { if (command.program.vertexShader->getOutputs() != command.program.fragmentShader->getInputs()) return false; } // Shader input/output types are set for (size_t varyingNdx = 0; varyingNdx < command.program.vertexShader->getInputs().size(); ++varyingNdx) if (command.program.vertexShader->getInputs()[varyingNdx].type != GENERICVECTYPE_FLOAT && command.program.vertexShader->getInputs()[varyingNdx].type != GENERICVECTYPE_INT32 && command.program.vertexShader->getInputs()[varyingNdx].type != GENERICVECTYPE_UINT32) return false; for (size_t varyingNdx = 0; varyingNdx < command.program.vertexShader->getOutputs().size(); ++varyingNdx) if (command.program.vertexShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_FLOAT && command.program.vertexShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_INT32 && command.program.vertexShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_UINT32) return false; for (size_t varyingNdx = 0; varyingNdx < command.program.fragmentShader->getInputs().size(); ++varyingNdx) if (command.program.fragmentShader->getInputs()[varyingNdx].type != GENERICVECTYPE_FLOAT && command.program.fragmentShader->getInputs()[varyingNdx].type != GENERICVECTYPE_INT32 && command.program.fragmentShader->getInputs()[varyingNdx].type != GENERICVECTYPE_UINT32) return false; for (size_t varyingNdx = 0; varyingNdx < command.program.fragmentShader->getOutputs().size(); ++varyingNdx) if (command.program.fragmentShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_FLOAT && command.program.fragmentShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_INT32 && command.program.fragmentShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_UINT32) return false; if (command.program.geometryShader) { for (size_t varyingNdx = 0; varyingNdx < command.program.geometryShader->getInputs().size(); ++varyingNdx) if (command.program.geometryShader->getInputs()[varyingNdx].type != GENERICVECTYPE_FLOAT && command.program.geometryShader->getInputs()[varyingNdx].type != GENERICVECTYPE_INT32 && command.program.geometryShader->getInputs()[varyingNdx].type != GENERICVECTYPE_UINT32) return false; for (size_t varyingNdx = 0; varyingNdx < command.program.geometryShader->getOutputs().size(); ++varyingNdx) if (command.program.geometryShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_FLOAT && command.program.geometryShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_INT32 && command.program.geometryShader->getOutputs()[varyingNdx].type != GENERICVECTYPE_UINT32) return false; } // Enough vertex inputs? if ((size_t)command.numVertexAttribs < command.program.vertexShader->getInputs().size()) return false; // There is a fragment output sink for each output? if ((size_t)command.renderTarget.getNumColorBuffers() < command.program.fragmentShader->getOutputs().size()) return false; // All destination buffers should have same number of samples and same size for (int outputNdx = 0; outputNdx < command.renderTarget.getNumColorBuffers(); ++outputNdx) { if (getBufferSize(command.renderTarget.getColorBuffer(0)) != getBufferSize(command.renderTarget.getColorBuffer(outputNdx))) return false; if (command.renderTarget.getNumSamples() != command.renderTarget.getColorBuffer(outputNdx).getNumSamples()) return false; } // All destination buffers should have same basic type as matching fragment output for (size_t varyingNdx = 0; varyingNdx < command.program.fragmentShader->getOutputs().size(); ++varyingNdx) { const tcu::TextureChannelClass colorbufferClass = tcu::getTextureChannelClass(command.renderTarget.getColorBuffer((int)varyingNdx).raw().getFormat().type); const GenericVecType colorType = (colorbufferClass == tcu::TEXTURECHANNELCLASS_SIGNED_INTEGER) ? (rr::GENERICVECTYPE_INT32) : ((colorbufferClass == tcu::TEXTURECHANNELCLASS_UNSIGNED_INTEGER) ? (rr::GENERICVECTYPE_UINT32) : (rr::GENERICVECTYPE_FLOAT)); if (command.program.fragmentShader->getOutputs()[varyingNdx].type != colorType) return false; } // Integer values are flatshaded for (size_t outputNdx = 0; outputNdx < command.program.vertexShader->getOutputs().size(); ++outputNdx) { if (!command.program.vertexShader->getOutputs()[outputNdx].flatshade && (command.program.vertexShader->getOutputs()[outputNdx].type == GENERICVECTYPE_INT32 || command.program.vertexShader->getOutputs()[outputNdx].type == GENERICVECTYPE_UINT32)) return false; } if (command.program.geometryShader) for (size_t outputNdx = 0; outputNdx < command.program.geometryShader->getOutputs().size(); ++outputNdx) { if (!command.program.geometryShader->getOutputs()[outputNdx].flatshade && (command.program.geometryShader->getOutputs()[outputNdx].type == GENERICVECTYPE_INT32 || command.program.geometryShader->getOutputs()[outputNdx].type == GENERICVECTYPE_UINT32)) return false; } // Draw primitive is valid for geometry shader if (command.program.geometryShader) { if (command.program.geometryShader->getInputType() == rr::GEOMETRYSHADERINPUTTYPE_POINTS && command.primitives.getPrimitiveType() != PRIMITIVETYPE_POINTS) return false; if (command.program.geometryShader->getInputType() == rr::GEOMETRYSHADERINPUTTYPE_LINES && (command.primitives.getPrimitiveType() != PRIMITIVETYPE_LINES && command.primitives.getPrimitiveType() != PRIMITIVETYPE_LINE_STRIP && command.primitives.getPrimitiveType() != PRIMITIVETYPE_LINE_LOOP)) return false; if (command.program.geometryShader->getInputType() == rr::GEOMETRYSHADERINPUTTYPE_TRIANGLES && (command.primitives.getPrimitiveType() != PRIMITIVETYPE_TRIANGLES && command.primitives.getPrimitiveType() != PRIMITIVETYPE_TRIANGLE_STRIP && command.primitives.getPrimitiveType() != PRIMITIVETYPE_TRIANGLE_FAN)) return false; if (command.program.geometryShader->getInputType() == rr::GEOMETRYSHADERINPUTTYPE_LINES_ADJACENCY && (command.primitives.getPrimitiveType() != PRIMITIVETYPE_LINES_ADJACENCY && command.primitives.getPrimitiveType() != PRIMITIVETYPE_LINE_STRIP_ADJACENCY)) return false; if (command.program.geometryShader->getInputType() == rr::GEOMETRYSHADERINPUTTYPE_TRIANGLES_ADJACENCY && (command.primitives.getPrimitiveType() != PRIMITIVETYPE_TRIANGLES_ADJACENCY && command.primitives.getPrimitiveType() != PRIMITIVETYPE_TRIANGLE_STRIP_ADJACENCY)) return false; } return true; } } // namespace RenderTarget::RenderTarget(const MultisamplePixelBufferAccess &colorMultisampleBuffer, const MultisamplePixelBufferAccess &depthMultisampleBuffer, const MultisamplePixelBufferAccess &stencilMultisampleBuffer) : m_numColorBuffers(1) , m_depthBuffer(MultisamplePixelBufferAccess::fromMultisampleAccess( tcu::getEffectiveDepthStencilAccess(depthMultisampleBuffer.raw(), tcu::Sampler::MODE_DEPTH))) , m_stencilBuffer(MultisamplePixelBufferAccess::fromMultisampleAccess( tcu::getEffectiveDepthStencilAccess(stencilMultisampleBuffer.raw(), tcu::Sampler::MODE_STENCIL))) { m_colorBuffers[0] = colorMultisampleBuffer; } int RenderTarget::getNumSamples(void) const { DE_ASSERT(m_numColorBuffers > 0); return m_colorBuffers[0].getNumSamples(); } DrawIndices::DrawIndices(const uint32_t *ptr, int baseVertex_) : indices(ptr) , indexType(INDEXTYPE_UINT32) , baseVertex(baseVertex_) { } DrawIndices::DrawIndices(const uint16_t *ptr, int baseVertex_) : indices(ptr) , indexType(INDEXTYPE_UINT16) , baseVertex(baseVertex_) { } DrawIndices::DrawIndices(const uint8_t *ptr, int baseVertex_) : indices(ptr) , indexType(INDEXTYPE_UINT8) , baseVertex(baseVertex_) { } DrawIndices::DrawIndices(const void *ptr, IndexType type, int baseVertex_) : indices(ptr) , indexType(type) , baseVertex(baseVertex_) { } PrimitiveList::PrimitiveList(PrimitiveType primitiveType, int numElements, const int firstElement) : m_primitiveType(primitiveType) , m_numElements(numElements) , m_indices(DE_NULL) , m_indexType(INDEXTYPE_LAST) , m_baseVertex(firstElement) { DE_ASSERT(numElements >= 0 && "Invalid numElements"); DE_ASSERT(firstElement >= 0 && "Invalid firstElement"); } PrimitiveList::PrimitiveList(PrimitiveType primitiveType, int numElements, const DrawIndices &indices) : m_primitiveType(primitiveType) , m_numElements((size_t)numElements) , m_indices(indices.indices) , m_indexType(indices.indexType) , m_baseVertex(indices.baseVertex) { DE_ASSERT(numElements >= 0 && "Invalid numElements"); } size_t PrimitiveList::getIndex(size_t elementNdx) const { // indices == DE_NULL interpreted as command.indices = [first (=baseVertex) + 0, first + 1, first + 2...] if (m_indices) { int index = m_baseVertex + (int)readIndexArray(m_indexType, m_indices, elementNdx); DE_ASSERT(index >= 0); // do not access indices < 0 return (size_t)index; } else return (size_t)(m_baseVertex) + elementNdx; } bool PrimitiveList::isRestartIndex(size_t elementNdx, uint32_t restartIndex) const { // implicit index or explicit index (without base vertex) equals restart if (m_indices) return readIndexArray(m_indexType, m_indices, elementNdx) == restartIndex; else return elementNdx == (size_t)restartIndex; } Renderer::Renderer(void) { } Renderer::~Renderer(void) { } void Renderer::draw(const DrawCommand &command) const { drawInstanced(command, 1); } void Renderer::drawInstanced(const DrawCommand &command, int numInstances) const { // Do not run bad commands { const bool validCommand = isValidCommand(command, numInstances); if (!validCommand) { DE_ASSERT(false); return; } } // Do not draw if nothing to draw { if (command.primitives.getNumElements() == 0 || numInstances == 0) return; } // Prepare transformation const size_t numVaryings = command.program.vertexShader->getOutputs().size(); VertexPacketAllocator vpalloc(numVaryings); std::vector vertexPackets = vpalloc.allocArray(command.primitives.getNumElements()); DrawContext drawContext; for (int instanceID = 0; instanceID < numInstances; ++instanceID) { // Each instance has its own primitives drawContext.primitiveID = 0; for (size_t elementNdx = 0; elementNdx < command.primitives.getNumElements(); ++elementNdx) { int numVertexPackets = 0; // collect primitive vertices until restart while (elementNdx < command.primitives.getNumElements() && !(command.state.restart.enabled && command.primitives.isRestartIndex(elementNdx, command.state.restart.restartIndex))) { // input vertexPackets[numVertexPackets]->instanceNdx = instanceID; vertexPackets[numVertexPackets]->vertexNdx = (int)command.primitives.getIndex(elementNdx); // output vertexPackets[numVertexPackets]->pointSize = command.state.point.pointSize; // default value from the current state vertexPackets[numVertexPackets]->position = tcu::Vec4(0, 0, 0, 0); // no undefined values ++numVertexPackets; ++elementNdx; } // Duplicated restart shade if (numVertexPackets == 0) continue; // \todo Vertex cache? // Transform vertices command.program.vertexShader->shadeVertices(command.vertexAttribs, &vertexPackets[0], numVertexPackets); // Draw primitives switch (command.primitives.getPrimitiveType()) { case PRIMITIVETYPE_TRIANGLES: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_TRIANGLE_STRIP: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_TRIANGLE_FAN: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_LINES: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_LINE_STRIP: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_LINE_LOOP: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_POINTS: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_LINES_ADJACENCY: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_LINE_STRIP_ADJACENCY: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_TRIANGLES_ADJACENCY: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } case PRIMITIVETYPE_TRIANGLE_STRIP_ADJACENCY: { drawAsPrimitives(command.state, command.renderTarget, command.program, &vertexPackets[0], numVertexPackets, drawContext, vpalloc); break; } default: DE_ASSERT(false); } } } } } // namespace rr