armv5 optimizations

author diego <diego@9553f0bf-9b14-0410-a0b8-cfaf0461ba5b>

Sun, 10 Sep 2006 22:29:02 +0000 (22:29 +0000)

committer diego <diego@9553f0bf-9b14-0410-a0b8-cfaf0461ba5b>

Sun, 10 Sep 2006 22:29:02 +0000 (22:29 +0000)
author diego <diego@9553f0bf-9b14-0410-a0b8-cfaf0461ba5b>
Sun, 10 Sep 2006 22:29:02 +0000 (22:29 +0000)
committer diego <diego@9553f0bf-9b14-0410-a0b8-cfaf0461ba5b>
Sun, 10 Sep 2006 22:29:02 +0000 (22:29 +0000)
diff --git a/libavcodec/mpegaudiodec.c b/libavcodec/mpegaudiodec.c

index 1fbde2039278f3b8f1a3c2efb687306da0f3b378..e9c78332bcf2acf0b639d0084761948354e74bb0 100644 (file)
--- a/libavcodec/mpegaudiodec.c
+++ b/libavcodec/mpegaudiodec.c
@@ -27,6 +27,11 @@
  #include "bitstream.h"
  #include "dsputil.h"
  
+/* Assume that all Intel XScale processors support armv5 edsp instructions */
+#if defined(ARCH_ARMV4L) && defined (HAVE_IWMMXT)
+#define ARCH_ARM5E
+#endif
+
  /*
   * TODO:
   *  - in low precision mode, use more 16 bit multiplies in synth filter
@@ -791,6 +796,17 @@ static inline int round_sample(int *sum)
          /* signed 16x16 -> 32 multiply */
  #       define MULS(ra, rb) \
              ({ int __rt; asm ("mullhw %0, %1, %2" : "=r" (__rt) : "r" (ra), "r" (rb)); __rt; })
+
+#   elif defined(ARCH_ARM5E)
+
+        /* signed 16x16 -> 32 multiply add accumulate */
+#       define MACS(rt, ra, rb) \
+            asm ("smlabb %0, %2, %3, %0" : "=r" (rt) : "0" (rt), "r" (ra), "r" (rb));
+
+        /* signed 16x16 -> 32 multiply */
+#       define MULS(ra, rb) \
+            ({ int __rt; asm ("smulbb %0, %1, %2" : "=r" (__rt) : "r" (ra), "r" (rb)); __rt; })
+
  #   else
          /* signed 16x16 -> 32 multiply add accumulate */
  #       define MACS(rt, ra, rb) rt += (ra) * (rb)
author	diego <diego@9553f0bf-9b14-0410-a0b8-cfaf0461ba5b>
	Sun, 10 Sep 2006 22:29:02 +0000 (22:29 +0000)
committer	diego <diego@9553f0bf-9b14-0410-a0b8-cfaf0461ba5b>
	Sun, 10 Sep 2006 22:29:02 +0000 (22:29 +0000)