libgpuarray/src/gpuarray_buffer_blas.c at master · NeutralCode/libgpuarray

221 lines (199 loc) · 8.56 KB
#include "private.h"
#include <gpuarray/error.h>
int gpublas_setup(gpucontext *ctx) {
  if (ctx->blas_ops == NULL)
    return GA_UNSUPPORTED_ERROR;
  return ctx->blas_ops->setup(ctx);
void gpublas_teardown(gpucontext *ctx) {
  if (ctx->blas_ops != NULL)
    return ctx->blas_ops->teardown(ctx);
const char *gpublas_error(gpucontext *ctx) {
  if (ctx->blas_ops != NULL)
    return ctx->blas_ops->error(ctx);
  return "No blas ops available, API error.";
int gpublas_hgemv(cb_order order, cb_transpose transA,
                  size_t M, size_t N, float alpha,
                  gpudata *A, size_t offA, size_t lda,
                  gpudata *X, size_t offX, int incX,
                  float beta,
                  gpudata *Y, size_t offY, int incY) {
  return gpudata_context(A)->blas_ops->hgemv(
    order, transA, M, N, alpha, A, offA, lda,
    X, offX, incX, beta, Y, offY, incY);
int gpublas_sgemv(cb_order order, cb_transpose transA,
                  size_t M, size_t N, float alpha,
                  gpudata *A, size_t offA, size_t lda,
                  gpudata *X, size_t offX, int incX,
                  float beta,
                  gpudata *Y, size_t offY, int incY) {
  return gpudata_context(A)->blas_ops->sgemv(
    order, transA, M, N, alpha, A, offA, lda,
    X, offX, incX, beta, Y, offY, incY);
int gpublas_dgemv(cb_order order, cb_transpose transA,
                  size_t M, size_t N, double alpha,
                  gpudata *A, size_t offA, size_t lda,
                  gpudata *X, size_t offX, int incX,
                  double beta,
                  gpudata *Y, size_t offY, int incY) {
  return gpudata_context(A)->blas_ops->dgemv(
    order, transA, M, N, alpha, A, offA, lda,
    X, offX, incX, beta, Y, offY, incY);
int gpublas_hgemm(cb_order order, cb_transpose transA, cb_transpose transB,
                  size_t M, size_t N, size_t K, float alpha,
                  gpudata *A, size_t offA, size_t lda,
                  gpudata *B, size_t offB, size_t ldb,
                  float beta, gpudata *C, size_t offC, size_t ldc) {
  return gpudata_context(A)->blas_ops->hgemm(
    order, transA, transB, M, N, K, alpha, A, offA, lda,
    B, offB, ldb, beta, C, offC, ldc);
int gpublas_sgemm(cb_order order, cb_transpose transA, cb_transpose transB,
                  size_t M, size_t N, size_t K, float alpha,
                  gpudata *A, size_t offA, size_t lda,
                  gpudata *B, size_t offB, size_t ldb,
                  float beta, gpudata *C, size_t offC, size_t ldc) {
  return gpudata_context(A)->blas_ops->sgemm(
    order, transA, transB, M, N, K, alpha, A, offA, lda,
    B, offB, ldb, beta, C, offC, ldc);
int gpublas_dgemm(cb_order order, cb_transpose transA, cb_transpose transB,
                  size_t M, size_t N, size_t K, double alpha,
                  gpudata *A, size_t offA, size_t lda,
                  gpudata *B, size_t offB, size_t ldb,
                  double beta, gpudata *C, size_t offC, size_t ldc) {
  return gpudata_context(A)->blas_ops->dgemm(
    order, transA, transB, M, N, K, alpha, A, offA, lda,
    B, offB, ldb, beta, C, offC, ldc);
int gpublas_hger(cb_order order, size_t M, size_t N, float alpha,
                 gpudata *X, size_t offX, int incX,
                 gpudata *Y, size_t offY, int incY,
                 gpudata *A, size_t offA, size_t lda) {
  return gpudata_context(X)->blas_ops->hger(
    order, M, N, alpha, X, offX, incX, Y, offY, incY, A, offA, lda);
int gpublas_sger(cb_order order, size_t M, size_t N, float alpha,
                 gpudata *X, size_t offX, int incX,
                 gpudata *Y, size_t offY, int incY,
                 gpudata *A, size_t offA, size_t lda) {
  return gpudata_context(X)->blas_ops->sger(
    order, M, N, alpha, X, offX, incX, Y, offY, incY, A, offA, lda);
int gpublas_dger(cb_order order, size_t M, size_t N, double alpha,
                 gpudata *X, size_t offX, int incX,
                 gpudata *Y, size_t offY, int incY,
                 gpudata *A, size_t offA, size_t lda) {
  return gpudata_context(X)->blas_ops->dger(
    order, M, N, alpha, X, offX, incX, Y, offY, incY, A, offA, lda);
int gpublas_hgemmBatch(
  cb_order order, cb_transpose transA, cb_transpose transB,
  size_t M, size_t N, size_t K, float alpha,
  gpudata **A, size_t *offA, size_t lda,
  gpudata **B, size_t *offB, size_t ldb,
  float beta, gpudata **C, size_t *offC, size_t ldc,
  size_t batchCount, int flags) {
  if (flags != 0) return GA_INVALID_ERROR;
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(A[0])->blas_ops->hgemmBatch(
    order, transA, transB, M, N, K, alpha, A, offA, lda,
    B, offB, ldb, beta, C, offC, ldc, batchCount);
int gpublas_sgemmBatch(
  cb_order order, cb_transpose transA, cb_transpose transB,
  size_t M, size_t N, size_t K, float alpha,
  gpudata **A, size_t *offA, size_t lda,
  gpudata **B, size_t *offB, size_t ldb,
  float beta, gpudata **C, size_t *offC, size_t ldc,
  size_t batchCount, int flags) {
  if (flags != 0) return GA_INVALID_ERROR;
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(A[0])->blas_ops->sgemmBatch(
    order, transA, transB, M, N, K, alpha, A, offA, lda,
    B, offB, ldb, beta, C, offC, ldc, batchCount);
int gpublas_dgemmBatch(
  cb_order order, cb_transpose transA, cb_transpose transB,
  size_t M, size_t N, size_t K, double alpha,
  gpudata **A, size_t *offA, size_t lda,
  gpudata **B, size_t *offB, size_t ldb,
  double beta, gpudata **C, size_t *offC, size_t ldc,
  size_t batchCount, int flags) {
  if (flags != 0) return GA_INVALID_ERROR;
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(A[0])->blas_ops->dgemmBatch(
    order, transA, transB, M, N, K, alpha, A, offA, lda,
    B, offB, ldb, beta, C, offC, ldc, batchCount);
int gpublas_hgemvBatch(
  cb_order order, cb_transpose transA,
  size_t M, size_t N, float alpha,
  gpudata **A, size_t *offA, size_t lda,
  gpudata **x, size_t *offX, size_t incX,
  float beta, gpudata **y, size_t *offY, size_t incY,
  size_t batchCount, int flags) {
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(A[0])->blas_ops->hgemvBatch(
    order, transA, M, N, alpha, A, offA, lda, x, offX, incX,
    beta, y, offY, incY, batchCount, flags);
int gpublas_sgemvBatch(
  cb_order order, cb_transpose transA,
  size_t M, size_t N, float alpha,
  gpudata **A, size_t *offA, size_t lda,
  gpudata **x, size_t *offX, size_t incX,
  float beta, gpudata **y, size_t *offY, size_t incY,
  size_t batchCount, int flags) {
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(A[0])->blas_ops->sgemvBatch(
    order, transA, M, N, alpha, A, offA, lda, x, offX, incX,
    beta, y, offY, incY, batchCount, flags);
int gpublas_dgemvBatch(
  cb_order order, cb_transpose transA,
  size_t M, size_t N, double alpha,
  gpudata **A, size_t *offA, size_t lda,
  gpudata **x, size_t *offX, size_t incX,
  double beta, gpudata **y, size_t *offY, size_t incY,
  size_t batchCount, int flags) {
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(A[0])->blas_ops->dgemvBatch(
    order, transA, M, N, alpha, A, offA, lda, x, offX, incX,
    beta, y, offY, incY, batchCount, flags);
int gpublas_hgerBatch(cb_order order, size_t M, size_t N, float alpha,
                      gpudata **x, size_t *offX, size_t incX,
                      gpudata **y, size_t *offY, size_t incY,
                      gpudata **A, size_t *offA, size_t lda,
                      size_t batchCount, int flags) {
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(x[0])->blas_ops->hgerBatch(
    order, M, N, alpha, x, offX, incX, y, offY, incY,
    A, offA, lda, batchCount, flags);
int gpublas_sgerBatch(cb_order order, size_t M, size_t N, float alpha,
                      gpudata **x, size_t *offX, size_t incX,
                      gpudata **y, size_t *offY, size_t incY,
                      gpudata **A, size_t *offA, size_t lda,
                      size_t batchCount, int flags) {
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(x[0])->blas_ops->sgerBatch(
    order, M, N, alpha, x, offX, incX, y, offY, incY,
    A, offA, lda, batchCount, flags);
int gpublas_dgerBatch(cb_order order, size_t M, size_t N, double alpha,
                      gpudata **x, size_t *offX, size_t incX,
                      gpudata **y, size_t *offY, size_t incY,
                      gpudata **A, size_t *offA, size_t lda,
                      size_t batchCount, int flags) {
  if (batchCount == 0) return GA_NO_ERROR;
  return gpudata_context(x[0])->blas_ops->dgerBatch(
    order, M, N, alpha, x, offX, incX, y, offY, incY,
    A, offA, lda, batchCount, flags);
Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

gpuarray_buffer_blas.c

Latest commit

History

gpuarray_buffer_blas.c

File metadata and controls